Está en la página 1de 1355

Gua Prctica del Curso

de Bioestadstica Aplicada
a las Ciencias de la Salud

Dr. Jacobo Daz Portillo

Gua Prctica del Curso


de Bioestadstica Aplicada
a las Ciencias de la Salud
Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta
Direccin Territorial de Ceuta
Hospital Universitario de Ceuta
Urb. Loma Colmenar, s/n
51003 Ceuta

Edita: Instituto Nacional de Gestin Sanitaria


Subdireccin General de Gestin Econmica y Recursos Humanos
Servicio de Recursos Documentales y Apoyo Institucional
Alcal, 56 28014 Madrid
El copyright y otros derechos de propiedad intelectual pertenecen
al Instituto Nacional de Gestin Sanitaria.
Se autoriza la reproduccin total o parcial para uso no comercial,
siempre que se cite explcitamente su procedencia.
Depsito Legal: M-33564-2011
NIPO: 865-11-010-6
Coleccin Editorial de Publicaciones del INGESA: 1.921

La medicina es una ciencia de probabilidades y el arte de manejar la incertidumbre...


La estadstica es la ciencia que permite tomar decisiones en situaciones
de incertidumbre.

Bailar JC III. Some uses of statistical thinking. En: Bailar JC III,


Mostoller F, editors. Medical uses of statistics. Boston: N Engl
J Med Books, 1992; p. 25-57.

ndice
Gua Prctica del Curso de Bioestadstica Aplicada
a las Ciencias de la Salud

Captulo 1
Pgina 10

Publicacin Bioestadstica: Introduccin.

Captulo 2

Pgina 72

Publicacin Bioestadstica: Variables y grficos.

Captulo 3

Pgina 161
Publicacin Bioestadstica: Tamao muestral, Error y .

Captulo 4
Pgina 214

Publicacin Bioestadstica: Error y . Evaluacin de pruebas


diagnsticas.

Captulo 5

Pgina 355
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cualitativa versus cualitativa.

Captulo 6

Pgina 450
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cualitativa versus cualitativa. Medidas
de asociacin.

Captulo 7

Pgina 640
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cuantitativa versus cuantitativa.

Captulo 8

Pgina 727
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cualitativa dicotmica versus
cuantitativa.

Captulo 9
Pgina 874

Publicacin Bioestadstica: Anlisis bivariante. Test de


contraste de hiptesis. Cualitativa policotmica versus
cuantitativa.

Captulo 10

Pgina 992

Publicacin Bioestadstica:
Medidas de concordancia. Variables cualitativas.

Captulo 11
Pgina 1021

Publicacin Bioestadstica: Medidas de concordancia.


Variables cuantitativas.

Captulo 12
Pgina 1158

Publicacin Bioestadstica: Anlisis multivariante.

Captulo 13
Pgina 1337

Publicacin Bioestadstica: Bibliografa.

Es una verdad muy cierta que, cuando no est a nuestro alcance determinar
lo que es verdad, deberemos buscar lo que es ms probable.
Discurso del Mtodo. Ren Descartes.

No existe ni el negro ni el blanco, solo existe una completa escala de grises...


La respuesta est dibujada en el aire...

Si, segn Montaigne, para juzgar cosas grandes y nobles, es necesario


poseer un alma igual de grande y noble(*), para juzgar un artculo cientfico
escrito por un colega es necesario poseer, adems, conocimientos,
experiencia, imparcialidad, confidencialidad, diligencia, una cierta dosis de
pedagoga y otra no menos esencial de compaerismo (**).

(*) Montaigne M. Les essais [libro en internet]. Versin HTML daprs ldition de 1595 [acceso 31 de
octubre de 2008]. Disponible en: http://www.bribes.org/trismegiste/montable.htm
(**) F. Antoja Rib. Revisores. Revista del laboratorio clnico. 2009; 2: 63.

C aptulo 1

Captulo 1
Publicacin Bioestadstica: Introduccin.

Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Pgina 10

C aptulo 1

Pgina 11

Bioestadstica aplicada a las Ciencias de la Salud


Definicin
La Estadstica es la ciencia que se ocupa de los mtodos y procedimientos
para recoger, clasificar, resumir, hallar regularidades y analizar los datos,
siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de
los mismos; as como de realizar inferencias a partir de ellos, con la finalidad
de ayudar a la toma de decisiones y en su caso formular predicciones.

C aptulo 1

Bioestadstica aplicada a las Ciencias de la Salud


Estadstica descriptiva
Describe, analiza y representa un grupo de datos utilizando mtodos
numricos y grficos que resumen y presentan la informacin contenida en
ellos.

Pgina 12

C aptulo 1

Pgina 13

Bioestadstica aplicada a las Ciencias de la Salud


Estadstica inferencial
Apoyndose en el clculo de probabilidades y a partir de datos de una
muestra (procedente de una poblacin), efecta estimaciones, decisiones,
predicciones u otras generalizaciones sobre un conjunto mayor de datos.
Permite generalizar los datos obtenidos a partir de una muestra a la poblacin
de la que proceden. Se basa en la teora de las probabilidades y trabaja con
los datos que le proporciona la estadstica descriptiva.

C aptulo 1

Pgina 14

Bioestadstica aplicada a las Ciencias de la Salud


Estadstica en Medicina
La medicina es una ciencia estadstica, pues siempre se trabaja con la
probabilidad de enfermar y con la oportunidad incierta del diagnstico y del
tratamiento. El mdico debe adecuar el conocimiento cientfico y tecnolgico
a la situacin clnica personal y social del paciente del que se ocupa en ese
momento, ya que no existen enfermedades sino enfermos. El buen juicio
mdico logra un equilibrio entre el riesgo que comporta toda intervencin
diagnstica y/o teraputica y el beneficio esperable de dicha intervencin
en el paciente concreto, lo que obliga a combinar ciencia y arte, pues no
es fcil trabajar con la incertidumbre, y slo la estadstica nos proporciona
el instrumento adecuado que nos permite convivir con el azar, y con las
limitaciones del conocimiento mdico.

C aptulo 1

Hay verdades que por sabidas no se dicen, y por no decirlas se olvidan...


Hay mentiras (mitos o leyendas) que por decirlas pueden terminar siendo
pseudorealidades o realidades virtuales.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada.
Hospital Universitario de Ceuta.

Pgina 15

C aptulo 1

Pgina 16

Mitos y Leyendas en Bioestadstica

Bobenrieth Astete M.A . Mitos y realidades en torno a la publicacin


cientfica. Med Clin (Barc) 2000; 114: 339-341.
Bobenrieth Astete M.A . Lectura crtica de artculos originales en Salud.
Medicina de Familia (And) 2001; 2: 81-90.
Profesor Bobenrieth Astete M.A.
Profesor de Metodologa de Investigacin y Escritura Cientfica.
Escuela Andaluza de Salud Pblica.

C aptulo 1

Pgina 17

Mitos y Realidades en Bioestadstica

MITO 1: La sonrisa de la esfinge.


Cul es el ser que por la maana anda con cuatro patas, luego por la
tarde con dos, y despus por la noche con tres patas, y que se vuelve
ms dbil cuanto ms patas tiene?
Hay dos hermanas una de las cuales engendra a la otra, y sta a su vez
engendra a la primera Quines son?

C aptulo 1

Pgina 18

Mitos y Realidades en Bioestadstica


REALIDAD 1: Respuesta de Edipo.
Cul es el ser que por la maana anda con cuatro patas, luego por la tarde
con dos, y despus por la noche con tres patas, y que se vuelve ms dbil
cuanto ms patas tiene?
Edipo respondi correctamente y dijo: el HOMBRE, porque la maana, la
tarde y la noche traducen las etapas de la vida. El da o comienzo de la vida
muestra al beb gateando en cuatro pies o patas, la tarde o mitad de la vida
es la adultez del ser humano caminando en dos pies y la noche o final de la
vida muestra al anciano con un bastn o sea en tres pies.
Hay dos hermanas una de las cuales engendra a la otra, y sta a su vez
engendra a la primera Quines son?
Edipo contest: el DA y la NOCHE.
Furiosa, la Esfinge se suicida lanzndose al vaco y Edipo fue aclamado como
el salvador de Tebas, y como premio, Edipo fue nombrado rey de Tebas.

C aptulo 1

Pgina 19

Mitos y Realidades en Bioestadstica


MITO 1: La sonrisa de la esfinge.
Cmo voy a ser capaz de presentar y defender una comunicacin cientfica
en cualquier foro pblico o mandar a publicar un artculo original a una revista
sanitaria ante tan docto auditorio?
Qu me van a preguntar? Qu me van a decir si no respondo o no lo hago
adecuadamente? Seguro que hago el ridculo
Seguro que me rechazan el artculo original cuando lo mande a publicar a la
revista...
Si lo publican seguro que alguien me lo critica con una carta al director
que se publica en el nmero siguiente, y todo el mundo va a conocer mis
deficiencias
Dr. Jacobo Daz Portillo
Coordinador de Formacin Continuada
Hospital Universitario INGESA de Ceuta

C aptulo 1

Realidad 1: Respuesta de Edipo


FORMACIN CONTINUADA

METODOLOGA DE INVESTIGACIN
BIOESTADSTICA
ESCRITURA CIENTFICA
PRESENTACIONES CIENTFICAS EN POWER POINT
BSQUEDA DE BIBLIOGRFICA SEGN CRITERIOS
DE MEDICINA BASADA EN LA EVIDENCIA

Pgina 20

C aptulo 1

Bioestadstica
La bioestadstica es la punta visible del iceberg de la metodologa de
investigacin.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

Pgina 21

C aptulo 1

Pgina 22

Mitos y Realidades en Bioestadstica


REALIDAD 1: Muchos investigadores tienen bien definido su estudio y
manejan correctamente las variables (datos), pero no aciertan cuando
escogen las pruebas estadsticas pertinentes, y llegan a la presentacin
oral (comunicacin) o a la redaccin de las revistas cientficas (artculo
original) trabajos que adolecen de una manifiesta mala sincrona entre los
datos obtenidos y su posterior anlisis estadstico.

Antoja Rib F. The innocence of the storks.


Rev Lab Clin 2010; 3 (2): 51.

C aptulo 1

Pgina 23

Mitos y Leyendas en Bioestadstica


REALIDAD 1: Los auditores de los congresos sanitarios y los revisores
de las revistas cientficas suelen ser colegas con un alto perfil profesional,
aceptable formacin en Metodologa de Investigacin, pero quizs sin un
alto nivel de conocimientos de anlisis estadstico de datos.

Antoja Rib F. The innocence of the storks.


Rev Lab Clin 2010; 3 (2): 51.

C aptulo 1

Mitos y Leyendas en Bioestadstica


REALIDAD 1: El Comit Cientfico de los congresos y los editores de las
revistas ante trabajos de difcil evaluacin metodolgica incorporan un
tercer revisor especialista en Bioestadstica que dictamina definitivamente
sobre la idoneidad de las herramientas metodolgicas empleadas por los
autores.

Antoja Rib F. The innocence of the storks.


Rev Lab Clin 2010; 3 (2): 51.

Pgina 24

C aptulo 1

Enseanza de la Bioestadstica Aplicada


MITO 2: Enseanza de la investigacin clnica.

Antonio Fraguas de Pablo (Forges).


Qu le pasa, Doctor?Eh?. Ediciones Doyma 1988 (Barcelona).

Pgina 25

C aptulo 1

Pgina 26

Mitos y Realidades en Bioestadstica


Enseanza autodidacta de la Bioestadstica aplicada
REALIDAD 2: La educacin autodidacta en Bioestadstica es el conjunto de
procesos que realizamos para incorporar nuevos conocimientos necesarios
para cada momento, donde uno mismo selecciona la informacin que
necesita y se evala a s mismo con el mtodo ensayo-error.
La educacin autodidacta es, creo firmemente, el nico tipo de educacin
que existe.
Isaac Asimov.

C aptulo 1

Pgina 27

Mitos y Realidades en Bioestadstica


MITO 3: Una publicacin sobre las ventajas de un nuevo tratamiento con
otro vigente que demuestra significacin estadstica (p < 0,05) posee, en
consecuencia, importancia y significacin clnica.

C aptulo 1

Mitos y Realidades en Bioestadstica


REALIDAD 3: Mediciones y afirmaciones de probabilidad pueden ser
de gran ayuda en la prctica mdica, pero nunca deben reemplazar en
muchos casos a
- La experiencia.
- La perceptividad.
- El sentido comn.
- Y la intuicin.

Dr. Manuel Bobenrieth Astete


Profesor de Metodologa de Investigacin y Escritura Cientfica
Escuela Andaluza de Salud Pblica.

Pgina 28

C aptulo 1

Pgina 29

Mitos y Realidades en las publicaciones cientficas


REALIDAD 3: El valor de p, debe ser valorado con precaucin y teniendo
en cuenta el contexto del estudio, su diseo, las caractersticas de la
muestra o la poblacin analizada, de los potenciales sesgos, etc. Y NUNCA
como una cifra mgica que nos seduzca tanto, que nos invite o autorice a
tomar decisiones o cambiar conductas relacionadas con la prctica clnica
cotidiana.
REALIDAD 3: Antes de tomar decisiones o cambiar conductas clnicas
basadas en un valor de p, se ha de considerar tambin la VALIDEZ
EXTERNA (generalizacin de los resultados obtenidos en ese estudio
respecto de la poblacin inicial y, si esas conclusiones pueden ser
extrapoladas a nuestros pacientes o nuestra realidad laboral (que pueden
ser distinta a la descrita en el estudio publicado y valorado por nosotros.

C aptulo 1

Pgina 30

Realidad 3
...de lo estadsticamente significativo a lo clnicamente relevante
Hallazgos estadsticos

Hallazgos clnicos

1. Reflejan la influencia del azar en el


resultado

1. Reflejan el valor biolgico del resultado

2. Derivan de grupos de individuos


3. Requieren cantidades adecuadas de
datos para ser vlidas
4. Las respuestas estadsticas son
probabilsticas
5. El anlisis estadstico siempre requiere
medicin.

2. Se practica en individuos especficos


3. Las decisiones clnicas deben tomarse a
menudo con datos insuficientes
4. Los tratamientos mdicos requieren
decisiones oportunas comprometidas
5. La prctica clnica no puede medir
fcilmente cada funcin, cada sistema,
cada signo o sntoma clnico

C aptulo 1

Realidad 3
...de lo estadsticamente significativo a lo clnicamente relevante
Por todo ello, es ms apropiado que hablar de SIGNIFICACIN
ESTADSTICA es ms correcto utilizar el concepto de RELEVANCIA
CLNICA; porque la relevancia clnica de un fenmeno va ms all de
clculos matemticos y depende de
1. La gravedad del problema,
2. La morbilidad y mortalidad generada por el mismo,
3. La magnitud de la diferencia,
4. La vulnerabilidad,
5. Los costes involucrados, etc.

Pgina 31

C aptulo 1

Pgina 32

Realidad 3
...de lo estadsticamente significativo a lo clnicamente relevante
Realidad 3: ...de lo
estadsticamente significativo a lo
clnicamente relevante.

Es clnicamente relevante?

Es estadsticamente significativo?

S (xito)

No (fracaso)

S (p < 0,05)

Clnicamente relevante

Clnicamente irrelevante (p < 0,05)

Estadsticamente significativo

Estadsticamente significativo

Error Alfa?
No (p > 0,1)

Clnicamente relevante

Clnicamente irrelevante

Estadsticamente NO
significativo

Estadsticamente NO significativo

Error Beta?

C aptulo 1

Pgina 33

Mitos y Realidades en Bioestadstica


REALIDAD 3: Un resultado estadsticamente significativo (p<0,05) sin
relevancia clnica no deja de ser una ANCDOTA; un hallazgo clnicamente
importante sin significacin clnica (p>0,1) no puede ser asumido como
concluyente, ya que no podemos atribuir con seguridad el hallazgo clnico a
la intervencin realizada (no podemos descartar la influencia del AZAR).

C aptulo 1

Mitos y Realidades en Bioestadstica


REALIDAD 3: Una prueba estadstica NO es una prueba de relevancia
cientfica. Bajo ningn concepto la relevancia del dato se encuentra en la
tcnica de anlisis, sino en la repercusin del mismo en el conocimiento
del objeto de estudio. Es perfectamente compatible encontrar diferencias
estadsticamente significativas que no suponen relevancia clnica, y
viceversa.

Guttman . What is not what statistics (1977).

Pgina 34

C aptulo 1

Mitos y Realidades en Bioestadstica


MITO 4: La ausencia de evidencia es evidencia de ausencia.
REALIDAD 4: La ausencia de evidencia NO es evidencia de ausencia.

Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ 1995;311:485.

Pgina 35

C aptulo 1

Pgina 36

Mitos y Realidades en Bioestadstica


MITO 4: La ausencia de significacin estadstica (p > 0,05) implica que
dos tratamientos comparados tienen la misma eficacia y por tanto pueden
prescribirse indistintamente.

Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ 1995;311:485.

C aptulo 1

Pgina 37

Mitos y Realidades en Bioestadstica


REALIDAD 4: Altman y Bland alertaron sobre un error comn en la
bibliografa biomdica: interpretar un resultado estadsticamente no
significativo, cuando se comparan dos tratamientos, como sinnimo de su
equivalencia teraputica.

Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ 1995;311:485.
Argimon JM. La ausencia de significacin estadstica en un ensayo clnico no significa equivalencia
teraputica. Med Clin (Barc) 2002; 118: 701-3.

C aptulo 1

Pgina 38

Mitos y Realidades en Bioestadstica


REALIDAD 4: Un valor de significacin estadstica mayor p > 0,05 se
etiqueta como no significativo. Estos estudios se les denomina negativos,
un trmino que implica errneamente que los tratamientos son iguales,
cuando lo nico que sucede es que no se ha podido demostrar una
diferencia. Ambos conceptos son distintos. Un resultado que no alcance
significacin estadstica quiere decir que (si en realidad no existe esa
diferencia), es probable que la observada en el estudio pueda haberse
producido simplemente por el AZAR (variabilidad aleatoria). No debe
interpretarse como indicativo de que no existe una diferencia en la realidad,
sino tan slo de que no puede descartarse esta posibilidad, en especial en
los estudios que han incluido a pocos sujetos.

C aptulo 1

Pgina 39

Mitos y Realidades en Bioestadstica


MITO 5: La estadstica es una religin que conduce a la salvacin a travs
del mgico ritual de la bsqueda de valores significativos de la p (p<0,05),
alcanzando entonces los autores la verdad absoluta y el paraso prometido
de la publicacin del trabajo en una revista de alto ndice de impacto.

C aptulo 1

Pgina 40

Mitos y Realidades en Bioestadstica


REALIDAD 5: En la bibliografa cientfica se est abusando del trmino
significacin estadstica. Numerosos investigadores dan por supuesto que
si en un estudio hallan una probabilidad (p) inferior a 0,05, ello certifica
la existencia tanto de la validez cientfica de su observacin como de la
relevancia clnica de la misma. Y ello est lejos de ser cierto.Su fe ciega en
el valor de la p contrasta con los detractores de su significado (ateos de la
estadstica).

C aptulo 1

Mitos y Realidades en Bioestadstica


REALIDAD 5: La estadstica es una herramienta til para el diseo
y realizacin de estudios sanitarios siempre que sea utilizada
adecuadamente.

Salsburg DS. The religion of statistics as practiced


in medical journals. Am Statistician 1985; 39: 220-223.

Pgina 41

C aptulo 1

Mitos y Realidades en Bioestadstica


REALIDAD 5: Los mtodos estadsticos NO son un sustituto del sentido
comn y la objetividad. Nunca deberan estar dirigidos a impresionar o
confundir al lector, sino que deben ser una contribucin importante a la
claridad de los conocimientos cientficos.

Pocock SJ. The role of statistics in medical research. Br J Psychiat 1980; 137: 188-190.

Pgina 42

C aptulo 1

Pgina 43

Mitos y Realidades en Bioestadstica


REALIDAD 5: Es fundamental hacer buenas preguntas de investigacin, lo
cual nos llevar a trabajos interesantes y respuestas con sentido comn, no
habr necesidad de SALIR DE PESCA para presentar al editor muchas
p menores de 0.05. Todo, con mesura y utilizado racionalmente, es bueno,
y la estadstica es un instrumento indispensable pero, como todo en la
vida, con SENTIDO COMN (y este sentido estadsticamente hablando no
parece ser a veces muy frecuente).

Dr. Juan M. Garca Torrecillas


Mdico de Especialista en Medicina Familiar y Comunitaria
Experto en Epidemiologa y Nuevas Tecnologas

C aptulo 1

Pgina 44

El Borracho
Utiliza la estadstica como un borracho usa una farola, para aguantarse
en lugar de para iluminarse

Andrew Lang

C aptulo 1

Pgina 45

Objetivo principal de la estadstica:


Cul es la probabilidad de que la diferencia observada en el estudio
se deba al AZAR?
- Una p < 0,05 indica que en menos de 5 veces de cada 100 que
repitiramos el mismo estudio, nuestro resultado se debera al AZAR.
- Cuanto mayor sea la p (p > 0,1) ms fuerte y segura ser la evidencia a
favor de la hiptesis nula (igualdad).
- El valor de la p no es un indicador de fuerza de asociacin, ni tampoco
de su importancia clnica.

C aptulo 1

Pgina 46

La Llave Dorada
La estadstica no es la llave dorada que abre la puerta de la verdad
absoluta e infinita
La verdad absoluta e infinita tiene una sonrisa diablica. Si consigo la llave dorada podr
abrir la puerta , y as podr conocer la verdad absoluta e infinita.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

C aptulo 1

Mitos y Realidades en Bioestadstica


MITO 6 (significantitis): Si p es mayor que el 5%, el resultado del estudio
no vale para nada; slo si es menor de 0,05, hemos hecho un gran
descubrimiento.

Chia KS. Significant-itis: an obsession with the P value. Scand J Work Environ Health. 1997; 23:152-4.
Christenson P. To p or not to p. J Child Adolesc Psychiatr Nurs. 1995; 8:42.

Pgina 47

C aptulo 1

Pgina 48

Mitos y Realidades en Bioestadstica


REALIDAD 6: Algunos, de forma irnica, a esta postura tan drstica y
que pocas veces est realmente justificada la consideran una autntica
enfermedad llamada significantitis o es como un problema de conciencia:
to p or not to p. Neyman et al. al considerar que haba que establecer un
lmite claro en el valor p para aplicar los razonamientos anteriores de forma
absoluta. Este valor crtico de p es el famoso 0,05 y marca el mtico lmite
de la significacin estadstica.

Neyman J, Pearson E. On the problem of the most efficient tests of statistical hypothesis. Philosophical trans
of the Royal Society of London (A) 1933;231:289-337.

C aptulo 1

Pgina 49

Mitos y Realidades en Bioestadstica


REALIDAD 6: Neyman et al lanzaron este lema exclusivamente bajo
el punto de vista de la toma de decisin ante un problema que fuera
trascendente y en el que, urgiera tal toma de decisin: rechazar o no la
hiptesis nula con sus consecuencias derivadas. Lo que ocurre es que se
ha universalizado demasiado y se lo ha sacado de su contexto, ya que se
aplica a cualquier inferencia estadstica, aunque el fin de la investigacin no
suponga obligacin alguna de tomar una decisin tan drstica, basada en la
ley del todo o nada.

Neyman J, Pearson E. On the problem of the most efficient tests of statistical hypothesis. Philosophical trans
of the Royal Society of London (A) 1933;231:289-337.

C aptulo 1

Pgina 50

Mitos y Realidades en Bioestadstica


MITO 7 (adoradores de la p): La esencia de la estadstica es la bsqueda
de los valores ms bajos de la p, (una p < 0,001 es mejor que una p < 0,01,
y sta superior a una p <0,05) ya que cuanto ms pequea sea esta p
mayor intensidad de asociacin y causalidad existir entre las variables y
mayor credibilidad tendrn las conclusiones de mi estudio.

C aptulo 1

Pgina 51

Mito 7: Adoradores de la p
El cual los tom de las manos, y formlo con buril, e hizo de ello un
becerro de fundicin. Entonces dijeron: Israel, estos son tus dioses, que
te sacaron de la tierra de Egipto

xodo 32, 1-6

C aptulo 1

Pgina 52

Mitos y Realidades en Bioestadstica


REALIDAD 7: La utilidad de la p es una medida de la influencia del AZAR
en la posible asociacin entre las variables analizadas, este azar debe ser
siempre contemplado, evaluado y cuantificado mediante el valor de la p. La
p NO es un indicador de fuerza de la asociacin entre variables, ni de su
importancia. Los valores de la p deben ser considerados solo como una
gua y no como base de conclusiones definitivas e irrevocables.

C aptulo 1

Pgina 53

Mitos y Realidades en Bioestadstica


MITO 8: Hace poco le en la prensa mdica la siguiente frase: Yo no
creo en la estadstica, (ATEOS de la estadstica) porque est claro que la
estadstica, como religin que es, es solo una cuestin de fe, que como tal
debe ser respetada (segn dice el artculo 16 de la Constitucin Espaola
sobre la libertad religiosa).

C aptulo 1

Pgina 54

Mitos y Realidades en Bioestadstica


REALIDAD 8: La estadstica constituye un instrumento cientfico que
requiere el cumplimiento de NUMEROSAS CONDICIONES para producir
resultados vlidos.
1. Es preciso que los experimentos tengan un diseo muy escrupuloso.
2. Es inexcusable aplicar en cada circunstancia aquellos mtodos que en
ella son idneos y controlar rigurosamente su validez.
3. NUNCA es legtimo deducir que un resultado significativo es clnicamente
relevante.
4. Una correlacin entre dos variables acabar siendo siempre significativa
(p < 0,05) si la muestra es lo suficientemente grande.
5. Por eso en algunos casos, se dice que: La estadstica es un
instrumento, que si no se usa adecuadamente, puede demostrar cualquier
MENTIRA.

C aptulo 1

Pgina 55

Mitos y Realidades en Bioestadstica


REALIDAD 8: Aplicando los mtodos estadsticos de forma abusiva (como
lo haca la Santa Inquisicin), si torturamos suficientemente a nuestros
datos, acabaran por confesarnos lo que nosotros queramos. El fin nunca
justifica los medios.

Ars A. Tmese una antes de acostarse. 1 edicin. Barcelona: Planeta; 1998.

C aptulo 1

La estadstica es un instrumento, que si no se usa adecuadamente, puede


demostrar cualquier mentira.
En Bioestadstica el fin nunca justifica los medios.

Pgina 56

C aptulo 1

Pgina 57

Mitos y Realidades en Bioestadstica


REALIDAD 8: Si los datos de un estudio se analizan con muchos enfoques
distintos y con la suficiente intensidad hasta TORTURARLOS, acaban
dando los resultados que al investigador le hubiese gustado obtener,
aunque tales resultados suelen ser cientficamente NEFASTOS.

Mills JL. Data torturing. N Engl J Med. 1993; 329: 1196-9.

C aptulo 1

Pgina 58

Mitos y Realidades en Bioestadstica


MITO 9: La inocencia de las cigeas
Una buena correlacin estadstica (coeficiente de correlacin r elevado)
(p < 0,05) siempre significa que existe una relacin entre las variables
evaluadas y, por tanto, existe una relacin causa - efecto.

C aptulo 1

Pgina 59

C aptulo 1

Mitos y Realidades en Bioestadstica


REALIDAD 9:
- Una buena correlacin estadstica (r elevado) (p < 0,05) NO siempre
significa que exista una relacin entres las variables evaluadas y, por
tanto, NO implica una relacin causa-efecto.
- El trabajo estara mal planteado, aunque se hubiera aplicado un
tratamiento estadstico aparentemente correcto.
- Los autores de un estudio deben ser muy cautos en la aplicacin y
posterior interpretacin del anlisis estadstico.

Antoja Rib F. The innocence of the storks. Rev Lab Clin 2010; 3 (2): 51.

Pgina 60

C aptulo 1

Estudio ecolgico

Variable PREDICTORA
Factor de exposicin (F)
CIGEAS

Nmero de ejemplares de
cigeas

Variable RESULTADO
Efecto o Enfermedad (E)
NATALIDAD HUMANA

Tasa de natalidad de la
poblacin humana

Pgina 61

C aptulo 1

Variable cuantitativa continua

Tasa de nacimientos en la poblacin humana

Variable RESULTADO-RESPUESTA-posible EFECTO

Estudio de Bartels (Alemania)

Enero
Mayo

Abril

Junio

Noviembre

Febrero
Marzo

Agosto
Octubre
Julio
Septiembre

Diciembre

Variable PREDICTORA-EXPOSICIN-posible CAUSA

Nmero de ejemplares de cigeas


Variable cuantitativa continua

Pgina 62

C aptulo 1

Estudio de Bartels (Alemania)


RESULTADOS: En Alemania, en un mismo ao, descendieron, de forma
significativa, la tasa de nacimientos de la poblacin humana y el nmero
de ejemplares de cigeas. La correlacin entre ambas variables era alta,
lo que demostraba cientficamente su relacin.
CONCLUSIN: La baja natalidad alemana en el ao de estudio se explica
por la disminucin del nmero de cigeas repartidoras de bebs. La
culpa era de las cigeas.

Pgina 63

C aptulo 1

Comentarios
- Es muy saludable encontrar detalles de humor.
- Si leyramos un supuesto artculo cientfico con esa conclusin tan extravagante
pensaramos, sin duda, que se trata de una parodia y como tal la aceptaramos.
- Es fcil entender el error porque sabemos que las cigeas no tienen nada que ver
con la reproduccin humana y, por tanto, se ha buscado errneamente una relacin
entre dos variables sin plausibilidad biolgica.
- El trabajo est mal planteado, y aunque se hubiera aplicado un tratamiento
estadstico aparentemente correcto.
- Una buena correlacin estadstica (r elevado) (p < 0,05) NO siempre significa que
existe una relacin entres las variables evaluadas, y por tanto NO implica una relacin
causa efecto.

Pgina 64

C aptulo 1

Reflexiones
Qu ocurre cuando el estudio se lleva a cabo con variables (datos) menos
conocidos, de poblaciones que nos son menos familiares, obtenidos en estudios
complejos?
Cmo sabemos si el autor sabe certeramente entre qu grupos se puede establecer
relaciones y entre cules no tiene sentido hacerlas?
Esto slo es posible si el investigador conoce muy bien lo que est estudiando y ha
partido de un planteamiento y el diseo del estudio bien estructurado.
Las conclusiones que se obtienen al aplicar las pruebas estadsticas slo tienen
sentido cuando las variables (datos) estn bien definidas y tienen plausibilidad
biolgica.

Pgina 65

C aptulo 1

Estos tipos de errores se originan cuando los autores NO tienen claros


algunos conceptos bsicos de METODOLOGA de INVESTIGACIN
pero disponen de programas estadsticos potentes, en los que slo
se necesita sealar y aceptar con el ratn entre un amplio abanico de
pruebas estadsticas.

Pgina 66

C aptulo 1

Parafraseando a Sneca , debemos convenir que


todo lo honesto es difcil
y la investigacin clnica no es una excepcin.

Sneca LA. De los beneficios. En: Lucio Anneo Sneca: Obras completas. Madrid: Aguilar, 1961.

Pgina 67

C aptulo 1

Pgina 68

Curso de Bioestadstica Aplicada


1. Introduccin a la bioestadstica.
2. Estadstica descriptiva. Variables y grficos.
3. Tamao muestral: Error alfa y error beta.
4. Evaluacin de pruebas diagnsticas.
5. Test de contraste de hiptesis: variable cualitativa versus cualitativa.
6. Test de contraste de hiptesis: variable cuantitativa versus cuantitativa.
7. Test de contraste de hiptesis: variable cuantitativa versus cualitativa.
8. Anlisis estadstico multivariante.
9. Utilidad de la bioestadstica en los resultados y discusin del estudio.

C aptulo 1

Salir de nuestra cueva de BENZ, de nuestro nicho ecolgico


Comunicar nuestra experiencia a los dems
Utilizando la bioestadstica como herramienta de trabajo.

Pgina 69

C aptulo 1

Etapas del proceso de investigacin


TEORIA
18. Conclusin
(Respuestas)

Fase interpretativa
DISCUSIN

1. Problema
(Preguntas)

2. Revisin
bibliogrfica

17. Alcance
y limitaciones
16. Importancia
Novedad

3. Marco
terico

15. Validez interna y


externa

13. Presentacin
de datos

Procesamiento
12. 12.
Procesamiento
de datos
estadstico
de datos

DEDUCCIN

INDUCCIN

4. Definicin
Variables

14. ANLISIS

Fase emprica
RESULTADOS

Fase conceptual
INTRODUCCIN

5. HIPTESIS
OBJETIVOS

6. Seleccin del
diseo

TEMA A INVESTIGAR
Campo de investigacin

11. Recoleccin
de datos

7. Identificacin de
la poblacin

8. Determinacin
Casos/muestra

9. Estudio
piloto

10. Fuentes de
informacin
HECHOS
DATOS

Fase planificacin
MATERIAL y
MTODOS

Pgina 70

C aptulo 1

La bioestadstica y el mtodo epidemiolgico aportan ms ciencia al arte de la


medicina y enfermera y es por ello que la colaboracin conjunta de expertos en
metodologa, bioestadsticos y los clnicos deben trabajar en equipo en colaboracin
para en un esfuerzo conjunto reducir la variabilidad que rodea al ejercicio de la
medicina y enfermera que ser siempre una ciencia de probabilidades y un arte de
manejar la incertidumbre.

Bioestadsticos

Expertos en
metodologa

Personal
sanitario

Pita Fernndez S. Dificultades de los mdicos para la realizacin de estudios clnico-epidemiolgicos.


Congreso Galego de Estadstica e Investigacin de Operacins. Santiago de Compostela, A Corua
(Espaa). 11-13 Novembre-1999.

Pgina 71

C aptulo 2

Captulo 2
Publicacin Bioestadstica: Variables y grficos.

Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Pgina 72

C aptulo 2

Materiales
Pacientes
1. Criterios de seleccin de la muestra (inclusin y exclusin).
2. Procedencia.
3. Tcnica de reclutamiento utilizada.
4. Tiempo empleado para reunir a todos los participantes.
5. Principales caractersticas de los pacientes.
- Edad
- Sexo
- Procedencia
- Gravedad
- Aos de evolucin de la enfermedad
- Patologas asociadas...
6. Clculo de tamao muestral.

Pgina 73

C aptulo 2

Tipos de variables

- Variables cualitativas
- Categricas nominales
- Dicotmicas o Binarias
- Policotmicas
- Categricas ordinales
- Variables cuantitativas
- Discretas
- Continuas

Categorizacin

Pgina 74

C aptulo 2

Pgina 75

Tipos de variables

- Variables CUALITATIVAS: Representan una cualidad o atributo que clasifica a cada


individuo en una de varias categoras. Pueden ser de dos tipos:
- Dicotmicas o binarias: La situacin ms sencilla es aquella en la que se clasifica cada
individuo en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador).
- Policotmicas: Es necesario un mayor nmero de categoras (color de los ojos, grupo
sanguneo, profesin, etctera).
- Variables CUANTITATIVAS: Son aquellas que pueden medirse, cuantificarse o
expresarse numricamente. Pueden ser de dos tipos:
- Continuas: Son aquellas que si admiten tomar cualquier valor dentro de un rango
numrico determinado, con uno o varios decimales (peso, talla, edad).
- Discretas: Son aquellas que NO admiten todos los valores intermedios en un rango.
Suelen tomar solamente valores enteros (nmero de hijos, abortos, partos, hermanos).

C aptulo 2

Pgina 76

Tipos de variables segn la escala de medida

Escalas nominales: Variables NOMINALES: sta es una forma de observar o medir en la


que los datos se ajustan por categoras que no mantienen una relacin de orden entre s.
- Sexo.
- Grupo sanguneo.
- Presencia o ausencia de una enfermedad.
- Presencia o ausencia de un factor de riesgo.
Escalas ordinales: Variables ORDINALES: En las escalas utilizadas para medirlas existe un
cierto orden, grado o jerarqua entre las categoras.
- Grado de disnea.
- Grado de dolor.
- Intensidad del hbito tabquico.
- Tipo de fumador.

C aptulo 2

Variables cualitativas categricas ordinales

- Grado de disnea.
- Grado de dolor.
- Intensidad del hbito tabquico.
- 1-9 cigarrillos/da.
- 10-20 cigarrillos/da.
- > 20 cigarrillos/da.
- Tipo de fumador.
- Exfumador.
- Fumador pasivo.
- Fumador activo.

Pgina 77

C aptulo 2

Categorizacin de variables cuantitativas


Variable
Cuantitativa continua
Triglicridos

Variable
Cualitativa dicotmica
Hipertriglicridemia
Normotriglicridemia
Categorizacin

Variable
Cuantitativa discreta
Test de APGAR

Variable
Cualitativa ordinal
Patolgico < 7
Dudoso = 7
Fisiolgico > 7
Categorizacin

Pgina 78

C aptulo 2

Tipos de variables
Ejemplos
Variables cualitativas
- Categricas nominales
- Binarias
- Policotmicas
- Ordinales
Variables cuantitativas
- Discretas
- Continuas

- Sexo
- Credo religioso en Ceuta
- Hipertensin
- Tipo de fumador
- Colesterolemia
- Nmero de abortos
- Nivel de instruccin
- Edad gestacional
- Frecuencia cardiaca
- Test de apgar

Pgina 79

C aptulo 2

Tipos de variables
Ejemplos
Variables cualitativas
- Categricas nominales
- Binarias
- Policotmicas
- Ordinales
Variables cuantitativas
- Discretas
- Continuas

- Antecedentes de IAM
- Grupo sanguneo
- Hipertensin
- Tipo de fumador
- Colesterolemia
- N intentos de dejar fumar
- Nivel econmico
- Edad
- Peso
- Test de apgar

Pgina 80

C aptulo 2

Pgina 81

Tipos de variables
Ejemplos
Variables cualitativas
- Categricas nominales
- Binarias
- Policotmicas
- Ordinales
Variables cuantitativas
- Discretas
- Continuas

- Desenlace
- Estado civil
- Inmunizacin toxoplasma
- Intensidad del hbito tabquico
- LDL colesterol
- Nmero de cigarrillos
- Grado de disnea
- Aos de evolucin
- Hemoglobina
- Nmero de hijos

C aptulo 2

Tipos de variables
Variable independiente (X)

Variable dependiente (Y)

Controlada por el investigador

Respuesta que no se controla

Informacin disponible

Informacin que se desea conseguir

Variable predictora

Variable desenlace

Variable previa

Variable criterio

Exposicin (F)

Resultado (E)

Posible causa

Posible efecto

Factor

Consecuencia

Regreso

Regresando

Pgina 82

C aptulo 2

Pgina 83

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable
Independiente o
PREDICTORA

Variable
Dependiente o
RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de Fisher
Test de McNemar
Q de Cochran
REGRESIN LOGSTICA

Si el tamao muestral es grande


Si el tamao muestral es pequeo
Dos grupos de muestras repetidas o apareadas
Ms de dos grupos de muestras repetidas o apareadas
Varias variables predictoras cualitativas

Cualitativa

Cuantitativa

t de Student
Anlisis de la Varianza
Test de Mann-Whitney
Test de Wilcoxon
Test de Kruskall-Wallis
Test de Friedman

Compara medias entre dos grupos independientes


Compara medias entre ms de dos grupos independientes
Dos grupos independientes No paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, grupos indendientes
Ms de dos grupos No paramtrico medidas repetidas

Cuantitativa

Cualitativa

Regresin logstica simple


Regresin logstica multivariante

Una sola variable predictora cuantitativa


Varias variable predictoras cuantitativa o cualitativas

Cuantitativa

Cuantitativa

Regresin lineal simple


Correlacin de Pearson
Correlacin de Sperman
REGRESIN MLTIPLE

Paramtrico
Paramtrico
No paramtrico
Varias variables predictoras cuantitativas

Cualitativa

Superviviencia

Kaplan-Meier
Long-Rank
Regresin de COX

Curvas de supervivencia
Compara curvas de superviviencia
Anlisis Multivariante

C aptulo 2

Fases del anlisis estadstico


1.- ANLISIS DESCRIPTIVO

2.-ANLISIS BIVARIANTE

3.- ANLISIS MULTIVARIANTE

Pgina 84

C aptulo 2

Estadsticos descriptivos

Medidas de tendencia central


- Media aritmtica
- Media geomtrica
- Media armnica
- Media ponderada
- Mediana
- Moda
Medidas de forma
- Asimetra
- Curtosis o apuntamiento

Medidas de dispersin
- Varianza
- Desviacin estndar
- Coeficiente de variacin
- Error estndar de la media
Medidas de posicin
- Cuantiles
- Percentiles

Pgina 85

C aptulo 2

Medidas de tendencia central

- Media aritmtica [x]


- Media geomtrica
- Media armnica
- Media ponderada
- Mediana (P50)
- Moda

Pgina 86

C aptulo 2

Pgina 87

Media aritmtica

- Principal medida de tendencia central, pero menos robusta que la media geomtrica o
media armnica.
- Se deja influir mucho por los valores extremos de la distribucin.
- Se suman todos los valores y se divide por el nmero total de individuos.
- Expresin con pocos decimales.

C aptulo 2

Pgina 88

Ejemplo: Cul es la nota de un alumno del curso de


metodologa de investigacin que ha obtenido las siguientes
calificaciones?
xi

valor

Peso

valor

Asistencia a clase (X1)

7,5

W1

20%

Tesina (prcticas) (X2)

5,5

W2

20%

Examen inicial (X3)

3/14 (2,1)

W3

10%

Examen final (X4)

11/14 (7,8)

W4

20%

Incremento en sus conocimientos (X4 - X3)

W5

30%

Media ponderada = 6,7

C aptulo 2

Mediana P50

- Medida de tendencia central robusta, de clculo fcil.


- No se deja influir mucho por los valores extremos de la distribucin.
- Coincide con el valor central del conjunto ordenado de observaciones que deja por
debajo y por encima a la mitad de las observaciones realizadas.
- Se debe utilizar siempre en dos casos:
- Bajo tamao muestral (para muestras pequeas) y/o
- Cuando existen observaciones extremas (perifricos)

Pgina 89

C aptulo 2

Medidas de dispersin
- Varianza [s2]

- Desviacin tpica o estndar [s]

- Coeficiente de variacin [CV]

- Error estndar de la media [EE]

Pgina 90

C aptulo 2

Cul de las siguientes


distribuciones presenta un
mayor valor de la media?
Cul de las siguientes
distribuciones presenta una
mayor dispersin?

Cul de las siguientes


distribuciones presenta una
mayor dispersin?
Cul de las siguientes
distribuciones presenta un
mayor valor de la media?

Pgina 91

C aptulo 2

Desviacin estndar (s)


- Medida de dispersin que nos suministra mucha informacin sobre la naturaleza de
una variable.
- Cuanto ms separados estn los valores de la media mayor ser su dispersin, y
mayor ser su desviacin estndar.
- Se debe representar como media (desviacin estndar), y NO como media
desviacin estndar.
- Su magnitud SI depende de las unidades de medida de la variable. NO permite la
comparacin directa de la dispersin de varias variables.

Pgina 92

C aptulo 2

Pgina 93

Coeficiente de variacin (CV)


- Medida de dispersin que relaciona que proporcin porcentual de la media representa
la desviacin estndar.
- Representa la desviacin estndar medida en unidades de magnitud relativas a la
media.
- Permite la comparacin directa de la dispersin de varias variables.
- Su magnitud NO depende de las unidades de medida de la variable.

C aptulo 2

Pgina 94

Cul de las siguientes variables presenta un mayor grado de


dispersin?
Repetibilidad interdiaria de los procedimientos de anlisis del metabolismo frrico
Componente

Media

Desviacin
estndar

Coeficiente de
variacin (CV %)

Hemoglobina

20

121,70

0,64

0,53

Hierro

20

0,99

0,01

1,20

Ferritina

20

94,50

4,24

4,49

Transferrina

20

3,25

0,094

2,89

Receptor soluble de la transferrina

20

2,39

0,13

5,44

Cul de las siguientes variables presenta un menor grado de


dispersin?

C aptulo 2

Pgina 95

Distribucin de los valores de una variable x


medidos en los individuos de una poblacin

Desviacin estndar: Mide el grado de


dispersin de todos los individuos que
forman la muestra (s) o la poblacin ().

Media poblacional desconocida de la que


proceden todas las muestras extradas

Sigma : desviacin
estndar de los individuos
de la poblacin general

Distribucin de las medias X observadas en las infinitas muestras


de tamao n que pueden obtenerse de una poblacin de media
y de desviacin estndar
DISTRIBUCIN
DE LAS MEDIAS
MUESTRALES

Error Estndar de la Media EEM: Mide el grado de dispersin de las medias de todas las posibles muestras
que pudieran extraerse de la poblacin. Mide el grado de dispersin de las medias muestrales respecto a la
media poblacional (desconocida).

C aptulo 2

Medidas de forma
Asimetra (coeficiente de asimetra g1 de Fisher)
Simtrica (coeficiente de asimetra g1 = 0)
Asimtrica (coeficiente de asimetra g1 0)

g1 =

i =1

3
i

R3

Asimetra positiva (coeficiente de asimetra g1 > 0)


Asimetra negativa (coeficiente de asimetra g1 < 0)

Curtosis o apuntamiento (coeficiente g2 curtosis de Fisher)


Mesocrtica (g2 = 0)
Platicrtica (g2 < 0)
Leptocrtica (g2 > 0)
Coeficiente g2 mide el grado de
APLASTAMIENTO de una curva

g2 =

i =1

R4

4
i

-3

Pgina 96

C aptulo 2

Medidas de forma
Asimetra

g1 =

i =1

R3

Histograma de frecuencias de una variable cuantitativa


con distribucin simtrica (coeficiente de asimetra g1 = 0)
Distribucin normal

[Asimetra] < 2 EEasimetra

g1 < 2 EE g1

Pgina 97

C aptulo 2

Medidas de forma
Asimetra

Histograma de frecuencias de una variable cuantitativa


con distribucin Asimtrica Positiva (coeficiente de asimetra g1 > 0)

Pgina 98

C aptulo 2

Histograma de frecuencias de una variable cuantitativa


con distribucin Asimtrica positiva (coeficiente de asimetra g1 > 0)

Moda
%

Mediana
Media

* Coeficiente de asimetra g1 > 0 (VALOR POSITIVO)


* La Mediana es un valor ms pequeo que la Media
* La cola de la distribucin se aleja por la derecha

Pgina 99

C aptulo 2

Medidas de forma
Asimetra

Histograma de frecuencias de una variable cuantitativa


con distribucin Asimtrica Negativa (coeficiente de asimetra g1 < 0)

Pgina 100

C aptulo 2

Histograma de frecuencias de una variable cuantitativa con


distribucin Asimtrica negativa (coeficiente de asimetra g1 < 0)

Mediana

Moda

Media

* Coeficiente de asimetra g1 < 0 (VALOR NEGATIVO)


* La Mediana es un valor ms grande que la Media
* La cola de la distribucin se aleja por la izquierda

Pgina 101

C aptulo 2

Pgina 102

Medidas de forma
Curtosis o apuntamiento
Coeficientes g2 de apuntamiento o curtosis de Fisher
Mesocrtica (g2 = 0)

Distribucin normal

Platicrtica (g2 < 0)

Leptocrtica (g2 > 0)

[curtosis] < 2 EEcurtois

g2 < 2 EE g2

C aptulo 2

Segn las medidas de forma Cmo puede clasificarse esta


variable?
Asimetra g1 = 0,01
Curtosis g2 = 0,02

Simtrica (g1 0)
Mesocrtica (g2 0)

Distribucin
NORMAL

Coeficientes de asimetra g1 y de apuntamiento o curtosis g2


en diversos tipos de distribuciones

Pgina 103

C aptulo 2

Segn las medidas de forma Cmo puede clasificarse esta


variable?
Asimetra g1 = + 2,98
Curtosis g2 = +11,53

Asimtrica (g1 >0)(+)


Leptocrtica (g2 >0)

Distribucin
ANORMAL

Coeficientes de asimetra g1 y de apuntamiento o curtosis g2


en diversos tipos de distribuciones

Pgina 104

C aptulo 2

Segn las medidas de forma Cmo puede clasificarse esta


variable?
Asimetra g1 = -1,59
Curtosis g2 = +1,97

Asimtrica (g1 <0)(-)


Leptocrtica (g2 >0)

Distribucin
ANORMAL

Coeficientes de asimetra g1 y de apuntamiento o curtosis g2


en diversos tipos de distribuciones

Pgina 105

C aptulo 2

Segn las medidas de forma Cmo puede clasificarse esta


variable?
Asimetra g1 = - 0,04
Curtosis g2 = - 1,37

Simtrica (g1 0)
Platicrtica (g2 <0)

Coeficientes de asimetra g1 y de apuntamiento o curtosis g2


en diversos tipos de distribuciones

Pgina 106

C aptulo 2

Segn las medidas de forma Como puede clasificarse esta


variable?
Asimetra g1= + 0,135
Curtosis g2 = + 0,320
Simtrica (g1 0)
Mesocrtica (g2 0)

Frecuencia

Sigue una Distribucin Normal?


Distribucin
NORMAL

Peso en adultos (Kg)

Test de Kolmogorov - Smirnov = 0,705

p = 0,702

Pgina 107

C aptulo 2

Segn las medidas de forma Cmo puede clasificarse esta


variable?
Asimetra g1 = + 0,713
Curtosis g2 = + 3,660
Frecuencia

Sigue una Distribucin Normal?


Distribucin ANORMAL

Asimtrica (g1 >0)(+)


Leptocrtica (g2 >0)

Edad

Test de Kolmogorov - Smirnov = 1,498

p = 0,022

Pgina 108

C aptulo 2

Medidas de posicin:
Cuartiles y percentiles

6 datos

Mediana P50
6 datos

120
110
110
95
92
91
90
88
85
76
76
73
72

Cuartil 3 = P75
Cuartil 2 = P50
Cuartil 1 = P25

RIC: Rango intercuartlico

Representacin esquemtica de la Mediana P50


(percentil 50) y de los cuartiles P75 y P25

RIC

Pgina 109

C aptulo 2

Grficos de caja (box-plot)


Bigote superior

=[1,5 * RI ] + P75

80

Tercer cuartil

70
60

P75

Rango intercuartlico (RI)

50

Tercer cuartil Primer cuartil

40
30

Mediana

20
10

Primer cuartil

Consumo de Cigarrillos / da

Bigote inferior

P50
P25

= P25 [1,5 * RI ]

Diagrama de caja (box & whister plot)

Pgina 110

C aptulo 2

Grficos de caja (box-plot)


Es legtimo un dato
puntual cuyo valor
es excepcionalmente
grande o pequeo?
Es 220 un valor mal
registrado?
Es el resultado de un
error o accidente en la
experimentacin?

Perifrico o Outlier

220
Bigote superior = 180

Mediana = 140

P75 = 158

RIC = 33
P25 = 125
Bigote inferior

Tensin arterial sistlica (mm Hg)

Diagrama de cajas con un individuo perifrico


Martnez Gonzlez MA, Jokin de Irala Estvez, Faulin Fajardo FJ. Bioestadstica amigable. Madrid:
Ediciones Daz de Santos; 2001.

Pgina 111

C aptulo 2

Tcnicas de deteccin de Outlier

Variable resultado

outlier?

Variable predictora

Pgina 112

C aptulo 2

Tcnicas de deteccin de Outlier

Variable resultado

Coeficiente de determinacin R2

Variable predictora

Pgina 113

C aptulo 2

Grficos de caja (box-plot)


Sigue el sTfR una Distribucin Normal?
6

Perifrico o Outlier

sTfR (mg/L)
Receptor soluble
de la transferrina
en suero (sTfR)

4
3

Tamao muestral N = 121

Distribucin de los valores de sTfR en el grupo de referencia

Pgina 114

C aptulo 2

Pgina 115

Grficos de caja (box-plot)

Variable resultado

Mediana
Media

Perifrico o Outlier

Grupos de estudio

C aptulo 2

Grficos de histograma

Frecuencia (%)

30

Asimetra positiva g1 >0


Mesocrtica g2 =0

Distribucin
ANORMAL

20

10

Perifricos o Outlier

1,50

2,00 2,25 2,50 2,75 3,00 3,25 3,50 3,75 4,00

4,25 4,50

5,00 5,25

Concentraciones del Receptor srico de la transferrina (sTfR) (mg/L)

Histograma de frecuencias de distribucin del sTfR en una poblacin sana

Pgina 116

C aptulo 2

Pgina 117

Grficos de histograma
195

Nmero total de observaciones

180

Asimetra positiva g1 >0


Mesocrtica g2 =0

165
150
135
120

Distribucin ANORMAL

105
90
75
60
45
30

Perifricos o Outlier

15
0

45

55

60

65 70

75

80

85

90

95 100 105 110 115 120

125

130

140

Tensin arterial diastlica (mm Hg)


Histograma de distribucin de la tensin arterial diastlica en el estudio de Venecia N= 1002

C aptulo 2

Distribucin uniforme discreta

Distribucin uniforme discreta

120

Frecuencia

100
80
60
40
20
0
1

Nmero de caras

Resultados empricos obtenidos en la realidad


despus de lanzar un dado 600 veces
Cul es el nmero que sale con ms frecuencia?

Pgina 118

C aptulo 2

Distribucin uniforme discreta

Distribucin uniforme discreta

1200
120

Frecuencia
Frecuencia

1000
100

80
60
40
20
0

800
600
400
200
0

Nmero
caras
de de
caras
Nmero

Resultados empricos obtenidos en la realidad


despus de lanzar un dado 600 veces
Cul es el nmero que sale con ms frecuencia?

Pgina 119

C aptulo 2

Distribucin normal
200

7 = 3+ 4, 4+ 3, 6+1, 1+ 6, 2+ 5, 5+ 2

180
160

12 = 6 + 6
2=1+1

Frecuencia

140
120
100
80
60
40
20
0

Sumas

10

11

12

Resultados empricos (sumatorio) obtenidos


en la realidad despus de lanzar dos dados 1000 veces

Cul es el nmero que sale con ms frecuencia?

Pgina 120

C aptulo 2

Frecuencia

Distribucin normal

10 11 12 13 14 15 16 17 18 19 20

21 22 23 24 25 26 27

28 29

Sumas
Resultados empricos (sumatorio) obtenidos en la realidad despus de lanzar 5 dados 1000 veces

Cul es el nmero que sale con MENOS frecuencia?

Pgina 121

C aptulo 2

Distribucin normal

Cambios que se van produciendo en la distribucin de frecuencias


al aumentar el nmero de factores independientes
y las repeticiones de la experiencia

Nmero de factores independientes: Nmero de dados


Repeticiones de la experiencia: Nmero de tiradas

Martnez Gonzlez MA, Jokin de Irala Estvez, Faulin Fajardo FJ. Bioestadstica amigable. Madrid:
Ediciones Daz de Santos; 2001.

Pgina 122

C aptulo 2

La altura de las personas sigue una distribucin normal?


De qu depende la altura de una persona?
1. De la altura del padre
2. De la altura de la madre
3. De su nutricin en la infancia y adolescencia
4. De la velocidad de maduracin de su esqueleto
5. Del aporte que reciba de vitamina D
6. Del aporte de calcio
7. Del ejercicio fsico
8. De sus niveles de hormona del crecimiento
9. Otras variables (algunos de ellas desconocidas)

Martnez Gonzlez MA, Jokin de Irala Estvez, Faulin Fajardo FJ. Bioestadstica amigable. Madrid:
Ediciones Daz de Santos; 2001.

Pgina 123

C aptulo 2

Caractersticas de la distribucin normal

1. Tener forma de campana.


2. Ser simtrica.
3. Mesocrtica (no excesivamente plana ni muy picuda).
4. Coincidir la media, mediana y moda.
5. Tener aproximadamente el 95% de sus valores dentro del intervalo media 2
desviaciones estndar.

Pgina 124

C aptulo 2

Distribucin normal
- El 100% de los valores deben estar por encima y por debajo
de 3 veces la desviacin estndar (s)
(valores entre X 3 s)
- La distribucin debe ser SIMTRICA. La asimetra en valor
absoluto g1 debe ser menor que 2 veces su error estndar
[Asimetra] < 2 EEasimetra g1 < 2 EEg1
- La distribucin debe ser MESOCRTICA. La curtois en valor
absoluto g2 debe ser menor que 2 veces su error estndar
[curtois] < 2 EEcurtois g2 < 2 EEg2

Pgina 125

C aptulo 2

Propiedades de la distribucin normal


1 f ( x) =
e
2

( x - )2
2 2

Pgina 126

C aptulo 2

Propiedades de la curva de Gauss

Media D.E. 68% del rea total


Media D.E. 68% del rea total
Media 2 D.E. 95% del rea total
Media 32 D.E.
D.E.
Media
95%
99% del
delrea
reatotal
total
Media 3 D.E. 99% del rea total

Pgina 127

C aptulo 2

Distribucin de la t de Student

= n-1

Grados de libertad = n - 1

valores " t " : t =

(x - )
s

Pgina 128

C aptulo 2

Distribucin de la F de Snedecor
s12 12
valores " F " : F = 2 2
s2 2

Grados de libertad 1 y 2

1 = n1 - 1 2 = n2 - 1

Pgina 129

C aptulo 2

Qu variables biolgicas siguen una distribucin normal?


En qu circunstancias y en qu poblaciones?
- Colesterol srico poblacin sana
- Consumo de alcohol
- Peso corporal
- Bilirrubina en pacientes cirrticos
- Urea en sangre en poblacin sana
- Urea en sangre en pacientes con insuficiencia renal
- Troponina I en poblacin sana
- Excrecin urinaria de sodio en orina de 24 horas
Asimtrica g1 > 0 (+)
Leptocrtica g2 > 0 (+)
Distribucin ANORMAL

Pgina 130

C aptulo 2

Histograma de la uremia en 504 individuos


Sigue una Distribucin Normal?
80

60

Frecuencia (%)

Criterio de normalidad

N = 504
Media (x) = 64,8
Desviacin estndar (s) = 44,69

X x
s< > s
2 2

S (desviacin tpica) < X (media aritmtica) /2 (CV<50%)


40

S (desviacin tpica) > X (media aritmtica)/2 (CV>50%)


44,69 > 64,8/2 (32,4) (CV=69%)

20

0
10

30

50

70

90 110

150

170

Uremia (mg/dl)

190 210

250

Distribucin ANORMAL

Pgina 131

C aptulo 2

Histograma de la urea en sangre en 94 pacientes con


insuficiencia renal
Sigue una distribucin normal?

Frecuencia (%)

20

N = 94
Media (x) = 126
Desviacin estndar (s) = 46,8

X x
s< > s
2 2

S (desviacin tpica) < X (media aritmtica)/2 (CV<50%)


10

46,8 < 126/2 (63) (CV=37%)

0
20

65

105

145

185

225

Uremia (mg/dl) en 94 pacientes con IR

Distribucin NORMAL

Pgina 132

C aptulo 2

Histograma de la urea en sangre en 410 individuos sin


insuficiencia renal
Sigue una distribucin normal?
140

N = 410
Media (x) = 51
Desviacin estndar (s) = 29,9

Frecuencia absoluta

120
100

> s

S (desviacin tpica) > X (media aritmtica)/2 (CV>50%)

80

29,9 > 51/2 (25,5) (CV=59%)

60
40

Distribucin ANORMAL

20
0

s<

10

45

80

110

145

180

Uremia (mg/dl) en 410 individuos sin IR

Pgina 133

C aptulo 2

Medidas de tendencia central


Medidas de dispersin o variabilidad
Media = 183,9
Desviacin estndar = 82,5
N = 293

40

Frecuencia relativa (%)

Distribucin
ANORMAL

Valores entre X 3 s (< 431,4)

S (desviacin tpica) < X (media aritmtica)/2 (CV<50%)

30

82.5 < 183.9/2 (91.9) (CV=45%)

20

Sigue una Distribucin Normal?


X3s

10
0
20

60

100

140

180 220

260 300

340

380

420

460

Excrecin urinaria de sodio en orina de 24 horas (Na24 h mEq/24)

X
2

> s

Pgina 134

C aptulo 2

Condiciones y pruebas de normalidad

90

Frecuencia (%)

80
70
60
50
40
30

Asimtrica (+) (g1 > 0)


Leptocrtica (+) (g2 > 0)
X
2

> s

Distribucin ANORMAL

CV > 50%
Perifricos o Outlier

20
10
0

Bilirrubinemia (mg/dl)
Distribucin de frecuencias de los niveles de bilirrubina en pacientes cirrticos.
(Distribucin Anormal con asimetra positiva)

Pgina 135

C aptulo 2

Condiciones y pruebas de normalidad

Frecuencia

Transformacin logartmica

Logaritmos de las concentraciones de bilirrubina srica


Distribucin de frecuencias de los logaritmos de los niveles
de bilirrubina en pacientes cirrticos.
Con esta transformacin matemtica se corrige la asimetra positiva anterior

Pgina 136

Pgina 137

C aptulo 2

50%

40%

40%

97.5% URL
30%
Frequency of normal population

30%

99% URL

20%

20%

10%

10%

0%
0,00

0,02

0,04

0.03
ng/mL

0,06

0.06
ng/mL

0,08

0,10

cTnI g/L

0,12

0,14

0,16

0,18

0%
0,20
5

Total Imprecision (CV%)

50%

Total I mprecision (CV%)

Frequency of normal population

Troponina I en poblacin sana

C aptulo 2

Frecuencia absoluta

La amilasemia sigue una Distribucin Normal?

Asimtrica (+) (g1 > 0)


Leptocrtica (+) (g2 > 0)
Distribucin ANORMAL
Perifricos o Outlier

Amilasemia (UI/l)

Pgina 138

Pgina 139

C aptulo 2

Estadsticos descriptivos de la amilasemia

Amilasa

Media

Desviacin tpica

549

90,86

135,043

Asimetra

Curtosis

g1

EEg1

g2

EEg2

11,359

0,104

170,89

0,208

Asimetra

Amilasa

Curtosis

g1

EEg1

g1/ EEg1

g2

EEg2

g2/ EEg2

11,359

0,104

109,22

170,89

0,208

821,6

[Asimetra] > 2 EEasimetra g2 > 2 EEg2

Distribucin ANORMAL

[Curtosis] > 2 EEcurtois g2 > 2 EEg2

Distribucin ANORMAL

C aptulo 2

Pgina 140

Test de normalidad

- Test de Kolmogoroff-Smirnoff-Lilliefors (test ms potente para muestra > 30 casos).


- Test de Shapiro-Wilk (la prueba ms potente para muestra < 30 casos).
- Test de DAgostino.
- Test de Anderson-Darling.
- Test chi-cuadrado de bondad de ajuste.
- Test de Contraste de asimetra: Sirve para contrastar la hiptesis de que el coeficiente de
asimetra de Fisher g1 es cero. Propiedad que verifica la distribucin normal (g1 = 0).
- Test de Curtosis: Contraste de apuntamiento, sirve para contrastar la hiptesis de que
el coeficiente g2 curtosis de Fisher (coeficiente de apuntamiento) es cero. Propiedad que
verifica la distribucin normal (g2 = 0).
- Test de Jarque-Bera.

C aptulo 2

Pgina 141

Test de Kolmogorov-Smirnov
- Es el test de normalidad ms difundido en los programas estadsticos.
- Otorga un MENOR PESO a las observaciones extremas (perifricos o OUTLIER) y por
ello es menos tolerante a las desviaciones que normalmente se producen en estos tramos
distales.
- Cuando se dispone de un nmero suficiente de datos (amplio volumen muestral), los
dems tests de normalidad sern capaces de detectar diferencias pequeas an cuando
estas no sean relevantes para la mayor parte de los objetivos, por eso se recomienda el
test de Kolmogorov-Smirnov (se considera uno de los tests ms potentes para muestras
mayores de 30 casos).
- Se basa en la idea de comparar la funcin de distribucin acumulada de los datos
observados con la de una DISTRIBUCIN NORMAL, midiendo la mxima distancia entre
ambas curvas.
- Como en todos los tests de contraste de hiptesis, la hiptesis nula (Ho) se rechaza
cuando el valor del estadstico calculado supera un cierto valor crtico (tabulado) que se
obtiene de una tabla de clculo de probabilidades.
- p > 0,05 se acepta la Ho (se cumple la normalidad), se pueden usar test paramtricos.
- p < 0,05 se acepta la Ha (no se cumple la normalidad), se deben usar test NO paramtricos.

C aptulo 2

Pregunta de investigacin
Los valores analticos de ambas tcnicas siguen una
distribucin normal?
Objetivo: Evaluacin de la amilasa tcnica 1 frente a la tcnica 2.
Amilasa (srica)
Tcnica 1

Amilasa (srica)
Tcnica 2

Cul es el test estadstico ms acertado?


Test de Kolmogorov-Smirnov

Pgina 142

C aptulo 2

Pgina 143

Test de Kolmogorov-Smirnov
Resultados del test

Tcnica 1

Tcnica 2

548

548

Media

91,03

79,29

Desviacin tpica

135,11

120,52

Absoluta

0,289

0,301

Positiva

0,289

0,301

Negativa

- 0,280

- 0,299

Z de Kolmogorov-Smirnov

6,763

7,034

Significacin bilateral

0,000

0,000

Parmetros normales
Diferencias ms extremas

Como la significacin p < 0,05 se rechaza la hiptesis nula Ho (normalidad) y se acepta la


hiptesis alternativa Ha (no se cumple la normalidad), se deben usar test NO paramtricos.

C aptulo 2

Test de Jarque-Bera
- El test de Jarque-Bera se realiza para contrastar:
H0: g1 = g2 = 0, lo que significa simetra y curtsis exactas (g = 0)
H1: g1 0 o g2 0 lo que significa que existe curtsis (g 0) o asimetra.
- La consecuencia es que si existe asimetra o curtsis falla la normalidad.
H0: p > 0,05
simetra y curtsis exactas (g = 0)
test paramtricos
H1: p < 0,05
curtsis (g 0) o asimetra
test NO paramtricos
- Al contrastarlo conjuntamente (curtsis y asimetra) exige un fallo mayor de alguna de
ellas o de ambas para rechazarse.
n

g1 =

i =1

R3

3
i

g2 =

4
i =1

R4

g12 g 22
JB = t + t = T +
-3
6 24
2
1

2
2

Pgina 144

C aptulo 2

Test de Jarque-Bera
Asimetranegativa:
positiva
Asimetra
casi nula:mayor
mediana
mediana
que
menorlaque
la media
media

Forma terica de la
normal

TEST de normalidad de JARQUE-BERA


Estadstico 2 = 1.54
valor de p = 0.463 (p > 0,05)

Se acepta la H0
H0: g1= g2= 0, lo que significa
simetra y curtsis exactas.
DISTRIBUCIN NORMAL

Curtsis negativa: mas


apuntamiento que la normal

Forma terica de la
distribucin emprica

Pgina 145

C aptulo 2

Estadstica descriptiva

TIPO DE DISTRIBUCIN

SIMTRICA

ASIMTRICA

ndice de tendencia central

Media

Mediana

ndice de dispersin

EEM

Rango intercuartil

Peso de valores extremos


(outlier o perifricos)

Importante

Escaso o nulo

Fiabilidad del estadstico

Mucha

Poca

Pgina 146

C aptulo 2

Pgina 147

Pruebas paramtricas: Requisitos

- Las variables cuantitativas tienen que ser continuas.


- Los datos siguen una distribucin normal.
- Los datos numricos se expresan con la media y la desviacin estndar o el EEM
- Homogeneidad de las varianzas muestrales.
- Tamao muestral > 30.
- Presentan un mayor poder de contraste que los tests no paramtricos, y pueden analizar
interacciones entre variables predictoras.
- Cuando se dan las condiciones de aplicacin, las pruebas paramtricas tienen ms
potencia que las no paramtricas, pero, cuando esto no es as, el riesgo alfa puede ser
mayor que el especificado de antemano.

C aptulo 2

Pruebas NO paramtricas: Requisitos

- Las variables cuantitativas pueden ser ordinales o discretas.


- Los datos siguen una distribucin libre (no necesariamente normal), uno de los grupos
puede tener una distribucin normal mientras que el otro no.
- Los datos numricos se expresan con la mediana y los intervalos intercuartlicos.
- Heterogeneidad de las varianzas muestrales (en uno o ms de un grupo).
- Tamao muestral < 30.
- Presentan un menor poder estadstico que los tests paramtricos.
- Trabajan con la simple ordenacin y recuento (asignando rankings) a los valores de la
variable sin importar el tipo distribucin.

Pgina 148

C aptulo 2

Principales pruebas NO paramtricas

- Chi cuadrado de Pearson.


- Test exacto de Fisher.
- Chi cuadrado de Mc Nemar.
- Q de Cochran.
- U de Mann Whitney.
- Wilcoxon.
- Kruskall Wallis.
- Friedman.

http://www.slideshare.net/freddygarcia/pruebas-no-parametricas-presentation

Pgina 149

C aptulo 2

Pgina 150

Pruebas robustas: Caractersticas

- Otra alternativa a los mtodos paramtricos; la utilizacin de los llamados mtodos


robustos. Estos mtodos son menos potentes que los paramtricos, pero se muestran
superiores a los no paramtricos clsicos.
- La principal de sus ventajas es que no se afectan por la existencia de datos anmalos.
- Los mtodos robustos pueden ser de utilidad para la realizacin de inferencias sin tener
que depurar los datos extremos.
- Como parmetros de localizacin (posicin central) se recomienda en primer lugar, el
estimador de Huber y, en segundo lugar, la media a-recortada muestral (con a = 0,2).
- Como medida de dispersin se utiliza la desviacin absoluta mediana estandarizada.
- Mtodos robustos para el contraste de hiptesis con los parmetros antes referidos, se
pueden construir intervalos de confianza robustos y realizar contrastes de hiptesis.

C aptulo 2

Pgina 151

Mtodos robustos para el clculo de medidas de posicin:


Medidas robustas de tendencia central
Media -winsorizada muestral
Se sustituye un determinado porcentaje, , (20% Generalmente) de valores extremos a
cada lado de la muestra por el valor ms prximo no sustituido.
Media -recortada muestral
Se eliminan las k observaciones extremas de cada lado en lugar de winsorizarlas,
calculando la media aritmtica de las observaciones restantes.
Mediana muestral
Divide la distribucin en dos partes con el mismo nmero de elementos.
Estimador de Huber
Se encuentra dentro de los denominados M-estimadores, que generalizan al estimador de
mxima verosimilitud con buenas propiedades de robustez y eficiencia. En este caso se
descartan las observaciones que sean mayores (o menores) a una constante.

C aptulo 2

Pgina 152

Mtodos robustos para el clculo de medidas de dispersin:


Medidas robustas de dispersin
Desviacin absoluta mediana estandarizada
Es la mediana de las desviaciones absolutas a la mediana.
Cuasi desviacin tpica -winsorizada muestral
En la que se sustituye un determinado porcentaje de valores extremos a cada lado de la
muestra por el valor ms prximo no sustituido.

C aptulo 2

Pgina 153

Pruebas Robustas de contraste de hiptesis

- Mtodos robustos para el contraste de hiptesis con los parmetros antes referidos, se
pueden construir intervalos de confianza robustos y realizar contrastes de hiptesis.
- El test de Yuen es una alternativa a las pruebas de la t de Student y U de Mann-Whitney
para tamaos muestrales pequeos y distribuciones no normales.
- Para comparar ms de dos medias, cuando no puede utilizarse el ANOVA clsico,
deberamos recurrir a los clsicos no paramtricos de Kruskal-Wallis o, mejor, a mtodos
robustos como la generalizacin robusta del test Welch, que utiliza medias a-recortadas
muestrales.
- Deberamos recurrir a mtodos no paramtricos (Spearman) o, mejor, a mtodos robustos
como el coeficiente de porcentaje ajustado poblacional y el estimador robusto de regresin
medio biponderado.

http://www.slideshare.net/freddygarcia/pruebas-no-parametricas-presentation

C aptulo 2

Seleccin de la muestra

Poblacin

Seleccin aleatoria

Muestra

TCNICAS DE MUESTREO
ERROR ALEATORIO
Parmetro
Media poblacional

Inferencia

Estructura del proceso de la INFERENCIA ESTADSTICA

Estadstico X
Media muestral

Pgina 154

C aptulo 2

Pgina 155

Prueba de rachas

- Sirve para determinar si una muestra de observaciones es o no aleatoria, es decir, si las


observaciones de una determinada secuencia son independientes entre si.
- En una serie temporal, las observaciones no son aleatorias: lo que ocurre con una
observacin cualquiera depende, de las caractersticas de una observacin anterior.
- En una muestra aleatoria, lo que ocurre con una observacin cualquiera sea
independiente de las caractersticas de la(s) observacion(es) anterior(es).
- Esta prueba permite determinar si el nmero de rachas (R), observado en una
determinada muestra de tamao n es lo suficientemente grande o lo suficientemente
pequea como para poder rechazar la hiptesis de independencia-aleatoriedad de las
observaciones.

C aptulo 2

Prueba de rachas

El concepto de RACHA hace referencia a una secuencia de observaciones de un


mismo tipo.
Supongamos que lanzamos una moneda al aire 10 veces seguidas, repitiendo la
experiencia en tres ocasiones
Cmo garantizamos que el resultado obtenido es ALEATORIO?

Pgina 156

C aptulo 2

Prueba de rachas
1 EXPERIENCIA: Tenemos 5 RACHAS: CCC, X,CC, XXX, C

C C C

C C

2 EXPERIENCIA: Tenemos 2 RACHAS: CCCCC, XXXXX

C C C C C
3 EXPERIENCIA: Tenemos 10 RACHAS: CX, CX, CX, CX, CX

En cul de las 3 experiencias podemos garantizar que el resultado obtenido es


ALEATORIO?

Pgina 157

C aptulo 2

Prueba de rachas
Prueba de RACHAS

EXP 1

EXP 2

EXP 3

Valor de prueba

Casos < Valor de prueba

Casos Valor de prueba

Casos en total

10

10

10

Nmero total de rachas

10

- 0,211

- 2,348

2,348

Significacin bilateral

0,833

0,019

0,019

Como el nivel de significacin es mayor a 0,05 en la experiencia 1, podemos


aceptar la hiptesis de independencia (Ho) y concluir que la secuencia de
observaciones estudiada es ALEATORIA.
Como el nivel de significacin es inferior a 0,05 en la experiencia 2 y 3,
podemos rechazar la hiptesis de independencia y concluir que la secuencia de
observaciones estudiada NO es aleatoria (Ha).

Pgina 158

C aptulo 2

Pregunta de investigacin
Los valores analticos de ambas tcnicas son aleatorias?
Objetivo: Evaluacin de la amilasa tcnica 1 frente a la tcnica 2.
Amilasa (srica)
Tcnica 1

Amilasa (srica)
Tcnica 2

Cul es el test estadstico ms acertado?


Prueba de RACHAS

Pgina 159

C aptulo 2

Prueba de rachas
Tcnica 1

Tcnica 2

Valor de prueba (mediana)

70

61

Casos < Valor de prueba

267

267

Casos Valor de prueba

282

281

Casos en total

549

549

Nmero total de rachas

259

263

- 1,393

- 1,012

Significacin bilateral

0,164

0,312

Como el nivel de significacin es mayor a 0,05 en ambas tcnicas, podemos


aceptar la hiptesis de independencia (Ho) y concluir que la secuencia de
observaciones estudiada es ALEATORIA.

Pgina 160

C aptulo 3

Captulo 3
Publicacin Bioestadstica: Tamao muestral, Error y .

Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Pgina 161

C aptulo 3

Pgina 162

Materiales y mtodos
Estructura
1. Tipo de diseo (estudio).
2. Sujetos incluidos (criterios de seleccin de la muestra).
3. Fuentes de informacin.
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales).
5. Instrumentos y procedimientos de medida (cuestionarios).
6. Definicin de las variables y covariables incluidas en el estudio (factor de
estudio y criterio de evaluacin).
7. Limitaciones y consideraciones ticas de la investigacin.
8. Pruebas estadsticas a utilizar (programa estadstico).

C aptulo 3

Materiales
Pacientes
1. Criterios de seleccin de la muestra (inclusin y exclusin).
2. Procedencia.
3. Tcnica de reclutamiento utilizada.
4. Tiempo empleado para reunir a todos los participantes.
5. Principales caractersticas de los pacientes.
- Edad.
- Sexo.
- Procedencia.
- Gravedad.
- Aos de evolucin de la enfermedad.
- Patologas asociadas...
6. Clculo de tamao muestral.

Pgina 163

C aptulo 3

Seleccin de la muestra

Poblacin

Seleccin aleatoria

Muestra

TCNICAS DE MUESTREO
ERROR ALEATORIO
Parmetro
Media poblacional

Inferencia

Estructura del proceso de la INFERENCIA ESTADSTICA

Estadstico X
Media muestral

Pgina 164

C aptulo 3

Pgina 165

INFERENCIA ESTADSTICA: Es el conjunto de procedimientos estadsticos que


permiten pasar de lo particular (la muestra) a lo general (la poblacin).
TCNICAS DE MUESTREO: Es el conjunto de procedimientos que permiten elegir
muestras que sean representativas de la poblacin (de todos los individuos de la
poblacin).
ERROR ALEATORIO: Es el error que se comete al estudiar un problema en base a una
muestra elegida al azar (es siempre un error inevitable). La imposibilidad de estudiar a
todos los individuos de la poblacin obliga al investigador a trabajar con muestras, lo
que supone siempre cometer un error aleatorio.

C aptulo 3

Muestra de la poblacin

Muestra
Poblacin en estudio
Poblacin diana

Pgina 166

C aptulo 3

Proceso de seleccin de individuos para el estudio


Poblacin diana: Conjunto de individuos al que hace referencia la pregunta principal
del objetivo del estudio. Es la poblacin a la que se deseara generalizar los resultados
obtenidos. Se define principalmente sobre la base de caractersticas demogrficas y
clnicas generales.
Criterios de seleccin

Validez externa

Poblacin de estudio: Es un subconjunto de la poblacin diana definida por criterios


de seleccin establecidos en un protocolo. Esta poblacin presenta determinadas
caractersticas geogrficas y temporales que la hacen accesible al estudio.
Muestreo

Validez interna

Muestra: Es un conjunto de individuos que pueden ser estudiados en el momento de


realizar el estudio y que cumplen con los criterios definidos en el protocolo de estudio.

Pgina 167

C aptulo 3

Poblacin diana: Pacientes con HTA esencial del rea sanitaria de Ceuta.
Criterios de seleccin

Validez externa

Poblacin de estudio: Pacientes con HTA esencial leve-moderada de edad comprendida


40-60 aos del rea sanitaria de Ceuta.

Muestreo

Validez interna

Muestra: Pacientes con HTA esencial leve-moderada de edad comprendida 40-60 aos
registrados en los ficheros del Centro de Salud 1 que incluyen la edad y el sexo.

Pgina 168

C aptulo 3

Pgina 169

Poblacin diana: Poblacin peditrica de Ceuta.


Criterios de seleccin

Validez externa?

Poblacin de estudio: Nios que acuden a la consulta de Atencin al nio sano de Atencin
Primaria de edad comprendida 12-14 aos.
Muestreo

Validez interna?

Muestra: Nios que acuden al Programa de Atencin al nio sano de los centros de Salud
de Atencin Primaria de edades comprendida entre 12-14 aos que sus madres demandan
la realizacin de una analtica rutinaria completa.

C aptulo 3

Pgina 170

Poblacin diana: Poblacin gestante de Ceuta.


Criterios de seleccin

Validez externa

Poblacin de estudio: Mujeres gestantes del rea sanitaria que acuden a la consulta de
Obstetricia del INGESA de Ceuta.

Muestreo

Validez interna

Muestra: Mujeres gestantes del rea sanitaria de Ceuta que acuden a la consulta de
Obstetricia del INGESA embarazo controlado- con cartilla de embarazo completa, que
incluyen las variables predictoras (etnia, nivel cultural, edad, etc) y la variable resultado
(determinacin de anticuerpos frente al virus de la rubeola en el primer trimestre) incluidas
en el estudio.

C aptulo 3

Pgina 171

Proceso de seleccin de individuos para el estudio


Poblacin diana: Poblacin inmigrante de Ceuta.
Criterios de seleccin

Validez externa

Poblacin de estudio: Individuos inmigrantes residentes en el campamento de Calamocarro


de Ceuta atendidos por el personal sanitario.

Muestreo

Validez interna

Muestra: Individuos inmigrantes residentes en el momento del estudio en el campamento


de Calamocarro de Ceuta, atendidos por el personal sanitario, y en cuya ficha se haban
recogido las variables predictoras (filiacin, pas de origen, edad), as como el resultado
de todas las pruebas complementarias (incluido la Variable resultado: prueba de la
tuberculina) incluidas en el estudio.

C aptulo 3

Material
Pacientes
- Criterios de seleccin de la muestra (inclusin y exclusin).
- Procedencia.
- Tcnica de reclutamiento utilizada.
- Tiempo empleado para reunir a todos los participantes.
- Principales caractersticas de los pacientes.
Edad.
Sexo.
Procedencia.
Gravedad.
Aos de evolucin de la enfermedad.
Patologas asociadas...
- Clculo de tamao muestral.

Pgina 172

C aptulo 3

Pgina 173

Qu error alfa y que error beta estoy dispuesto a asumir?


Cuntos pacientes debo elegir para que mi estudio sea correcto?

C aptulo 3

Concepto e importancia y utilidad prctica del error alfa


() y error beta ()
- Determinacin del tamao muestral
- Estudios para determinar parmetros poblacionales (slo error alfa)
Estimacin de una proporcin
Estimacin de una media
- Estudios para contraste de hiptesis (error alfa y beta)
Comparacin de dos proporciones
Comparacin de dos medias
Correlacin entre dos variables cuantitativas
- Rentabilidad diagnstico de una prueba-test
- Exactitud
Sensibilidad
Especificidad
- Seguridad
Valor predictivo positivo (VPP)
Valor predictivo negativo (VPN).

Pgina 174

C aptulo 3

Riesgos al tomar decisiones


Ejemplo: Se juzga a un individuo por la presunta comisin de un delito
H0: Hiptesis nula
- Es inocente (no se encuentran
indicios de culpabilidad)

Los datos pueden refutarla


Es la hiptesis que se acepta si las
pruebas no indican lo contrario
Rechazarla por error tiene graves
consecuencias (condenar a un
inocente)

H1: Hiptesis alternativa


- Es culpable (se encuentran
indicios de culpabilidad)

No debera ser aceptada sin


una gran evidencia a favor.
Rechazarla por error tiene
consecuencias consideradas
menos graves que la anterior
(liberar a un delincuente)

Pgina 175

C aptulo 3

Pgina 176

Tipos de error al tomar una decisin


Tipos de error al tomar una decisin

Realidad
Culpable

Veredicto
Resultado de la prueba
Sentencia del juez

Inocente

Culpable
OK
Hiptesis ALTERNATIVA No error
aceptada
VP
Ha

Error
Muy grave
FP
Encarcelar a un inocente

Inocente
Hiptesis NULA
aceptada
Ho

OK
No error
VN

Error
FN
Menos grave: Liberar un
culpable

C aptulo 3

Pgina 177

Hiptesis nula (Ho): No existen diferencias significativas en la eficacia clnica de dos


frmacos A y B (A=B)
Hiptesis alternativa (Ha): Existen diferencias en la eficacia clnica de dos frmacos A y B
(A B)
A>BA<B
Tipos de ERROR ALEATORIO en una prueba estadstica de contraste de hiptesis

A B
Ha

Ho

AB
Ha

VP

FP

A=B
Ho

FN

VN

A=B

Error tipo I (alfa): El investigador rechaza la Ho siendo esta verdadera en la poblacin (el
investigador concluye que existe diferencia cuando en realidad no la hay).
Error tipo II (beta): El investigador no rechaza la Ho siendo esta falsa en la poblacin (el
investigador concluye que ha sido incapaz de encontrar una diferencia que existe en la
realidad).

C aptulo 3

Tipos de error al contrastar hiptesis


Realidad

Rechazo H0
Acepto H1
AB

H0 Falsa
AB

H0 Cierta
A=B

Correcto
El tratamiento nuevo B tiene
mayor efecto que A y el
experimento lo confirma.

Error de tipo I
El tratamiento nuevo B realmente no es
mejor que el antiguo A pero se decide
errneamente que s.
Probabilidad

VP
No Rechazo H0
Acepto H0
A=B

Error de tipo II
El tratamiento nuevo B
realmente si tiene mayor efecto
que el antiguo A pero no lo
percibimos en nuestro estudio.
Probabilidad
FN

FP
Correcto
El tratamiento nuevo B no tiene mayor
efecto que el antiguo A y as se decide.
VN

Pgina 178

C aptulo 3

Tipos de error al contrastar hiptesis


Realidad

Rechazo H0
Acepto H1
AB
Encuentro pruebas (+)
p < 0,05

No Rechazo H0
Acepto H0
A=B
No encuentro pruebas (-)
p > 0,05

H0 Falsa
AB

H0 Cierta
A=B

Correcto
Se rechaza la hiptesis nula (H0)
(se dice que los resultados son
estadsticamente significativos y
es verdad.

Error de tipo I
Se rechaza la H0 (se dice que los
resultados son estadsticamente
significativos) pero nos equivocamos.
Probabilidad

VP

FP

Error de tipo II
No se rechaza la hiptesis
nula (H0) (se dice que no hay
diferencias significativas) pero
nos equivocamos. Probabilidad

Correcto
No se rechaza la hiptesis nula H0 (el
azar puede explicar las diferencias
observadas en los datos), y es verdad.

FN

Error BETA

VN

Error ALFA

Pgina 179

C aptulo 3

Pgina 180

Tipos de error al contrastar hiptesis


Realidad

Ha
Encuentro pruebas (+)
p < 0,05

Ha

H0

Acierto
(1- )
POTENCIA ESTADSTICA

Error de tipo I

FP

Error ALFA

VP
H0
Error de tipo II
No encuentro pruebas (-)
p > 0,05
FN

Acierto
(1- )

Error BETA

VN

POTENCIA ESTADSTICA: Es la capacidad del estudio para detectar una diferencia si sta existe realmente.

C aptulo 3

Pgina 181

Tipos de error al contrastar hiptesis


Realidad

Ha
Encuentro pruebas (+)
p < 0,05

Ha

H0

Acierto
(1- )
POTENCIA ESTADSTICA

Error de tipo I

FP

Error ALFA

VP
H0
Error de tipo II
No encuentro pruebas (-)
p > 0,05
FN

Acierto
(1- )

Error BETA

VN

NIVEL DE CONFIANZA (1 - ): Es la probabilidad a priori de que el intervalo de confianza (IC) a calcular


contenga al verdadero valor del parmetro

C aptulo 3

El error tipo I (error alfa)

- En nuestro estudio se concluye diciendo que hay diferencias cuando


realmente no las hay.
- Se detecta significacin estadstica (p < 0,05) y se rechaza H0, cuando en
realidad sta es verdadera.
- La probabilidad de cometer este error es lo que mide la p.
FALSOS POSITIVOS

Pgina 182

C aptulo 3

Pgina 183

El error tipo II (error beta)

- Cuando los resultados de nuestro estudio NO son significativos (p>0,05)


se concluye diciendo que no hay diferencias (estudio negativo) cuando
realmente SI las hay, pero nosotros no hemos sido capaces de detectarlas
- La probabilidad de tomar esta decisin (y aceptar la H0) siendo
incorrecta se llama error beta.
- En realidad existen diferencias pero el estudio ha sido incapaz de
detectarlas!
- Son los falsos negativos.
FALSOS NEGATIVOS

C aptulo 3

Pgina 184

Recomendaciones para disminuir el error alfa () tipo I


- Disponer de una teora que gue la investigacin, evitando el salir de pesca
con el ordenador buscando asociaciones entre variables.
- Disminuir el nmero de test estadsticos llevados a cabo en el estudio.
- Depurar la base de datos para evitar errores de valores extremos que
puedan producir hallazgos significativos.
- Utilizar valores de alfa ms reducidos (0,01 0,001).
- Reproducir el estudio. Si al reproducir el estudio se obtienen resultados
similares, estaremos ms seguros de no estar cometiendo el error de tipo I.

Pita Fernndez S, Prtega Daz S. Significancia estadstica y relevancia clnica.


Cad Aten Primaria 2001; 8: 191-195.

C aptulo 3

Recomendaciones para disminuir el error beta () tipo II


- Incrementar el tamao de la muestra.
- Estimar el poder estadstico del estudio (1 ).
- Incrementar el tamao del efecto a detectar.
- Incrementar el valor de alfa.
- Utilizar test paramtricos (ms potentes) en lugar de test no paramtricos

Pita Fernndez S, Prtega Daz S. Significancia estadstica y relevancia clnica.


Cad Aten Primaria 2001; 8: 191-195.

Pgina 185

C aptulo 3

Importancia del error alfa y error beta


- Determinacin del tamao muestral
- Estudios para determinar parmetros poblacionales (slo error alfa)
- Estimacin de una proporcin.
- Estimacin de una media.
- Estudios para contraste de hiptesis (error alfa y beta).
- Comparacin de dos proporciones.
- Comparacin de dos medias.
- Correlacin entre dos variables cuantitativas.
- Rentabilidad diagnstico de una prueba-test.
- Sensibilidad.
- Especificidad.
- Valor predictivo positivo (VPP).
- Valor predictivo negativo (VPN).

Pgina 186

C aptulo 3

Pgina 187

Clculo del tamao muestral de un parmetro


1. VARIABILIDAD del parmetro que se desea estimar
- Variables cuantitativas: varianza
- Variables cualitativas: 1-P
1. Variabilidad del parmetro
Cuando esta variabilidad es desconocida
- Bibliografa
- Datos propios previos
- Estudio piloto

2. PRECISIN (i) con la que se desea obtener la estimacin (amplitud deseada del IC). Se
fija i previo al estudio. Cuanto ms precisin ms estrecho ser el IC, y mayor deber ser
el volumen muestral.
2. Precisin

3. NIVEL DE CONFIANZA deseado (generalmente 95%), que corresponde a un valor de


alfa de 0,05. Este valor indica el grado de confianza de que el verdadero valor poblacional
desconocido del parmetro en estudio se site en el intervalo obtenido.
3. Nivel de confianza 95%

C aptulo 3

Frmulas para el clculo del nmero de sujetos necesarios para la realizacin de un estudio
cuyo objetivo es la estimacin de un parmetro
Estimacin de una variable CUALITATIVA (proporcin - prevalencia)

N=

Z2 * P * (1- P)
i2

Estimacin de una variable CUANTITATIVA (MEDIA)

N=

Z2 * s2
i2

N = nmero de sujetos necesarios


Z 2 = Valor del estadstico Z correspondiente al riesgo alfa fijado ( = 0,05)
P = Valor de la proporcin (prevalencia) que se supone que existe en la poblacin
S2 = Varianza de la distribucin de la variable cuantitativa que se supone que existe en la poblacin
i: Precisin con que se desea estimar el parmetro

Pgina 188

C aptulo 3

Pgina 189

Influencia del valor supuesto de la proporcin (P) o prevalencia (variabilidad del Parmetro
que se desea estimar sobre el nmero de sujetos necesarios N (tamao muestral mnimo
necesario).
INFLUENCIA DE LA PROPORCIN

1. Variabilidad del parmetro

2. Precisin (i = 0,05)

3. Nivel de confianza 95% = 0,05

Prevalencia

Precisin (i = cte)

Tamao muestral (N)

0,10

0,05 (5%)

138

0,20

0,05 (5%)

246

0,30

0,05 (5%)

323

0,40

0,05 (5%)

369

0,50

0,05 (5%)

384

Postura de mxima indeterminacin

i = Z P (1 P) / N

Todos los clculos han sido realizados con un nivel de confianza del 95%
P = valor supuesto de la proporcin que se desea estimar.
i = precisin de la estimacin, que corresponde a la mitad del intervalo de confianza (P i)
N = nmero de sujetos necesarios para realizar la estimacin de P con la precisin deseada y el 95%
de confianza

C aptulo 3

Pgina 190

Influencia de la precisin (i) de la estimacin sobre el nmero de sujetos necesarios N


(tamao muestral mnimo necesario).

INFLUENCIA DE LA PRECISIN
1. Variabilidad del parmetro (P=cte)

2. Precisin (i = 0,05)

3. Nivel de confianza 95% = 0,05

Prevalencia

Precisin (i = cte)

Tamao muestral (N)

0,40

0,1 (10%)

92

0,40

0,075 (7,5%

164

0,40

0,050 (5%)

369

0,40

0,025 (2,5%)

1475

0,40

0,01 (1%)

9220

i = Z P (1 P) / N
Todos los clculos han sido realizados con un nivel de confianza del 95% ( = 0,05)
P = valor supuesto de la proporcin que se desea estimar.
i = precisin de la estimacin, que corresponde a la mitad del intervalo de confianza (P i)
N = nmero de sujetos necesarios para realizar la estimacin de P con la precisin deseada y el 95%
de confianza

C aptulo 3

Cul es el tamao muestral necesario para conocer la prevalencia de


inmunizacin toxoplsmica en la ciudad de Ceuta?

Postura de mxima
indeterminacin

Precisin 5%
i = 0,05
Tamao muestral necesario (n) para conocer la prevalencia
de inmunizacin frente a Toxoplasma gondii en la poblacin
de la ciudad de Ceuta

Pgina 191

C aptulo 3

Variabilidad
Precisin 5%
i = 0,05

i = 0,05
Precisin 5%

Nivel de confianza
95%
= 0,05

Tamao muestral necesario (n) para conocer la prevalencia


de inmunizacin frente a Toxoplasma gondii en la poblacin
de la ciudad de Ceuta

Pgina 192

C aptulo 3

Cul es el tamao muestral necesario para conocer la prevalencia de rasgo


beta-talasmico en la ciudad de Ceuta?

i = 0,005
Precisin 0,5%

Pgina 193

C aptulo 3

Variabilidad
Precisin i = 0,5%

Nivel de confianza
95%
= 0,05

i = 0,005
Precisin 0,5%

Pgina 194

C aptulo 3

Pgina 195

Cuntas personas tenemos que estudiar para conocer la


prevalencia de diabetes tipo 2 en el distrito de salud X de
Ceuta que atiende a una poblacin de 15.000 habitantes?
1.

Proporcin esperada: asumamos que puede ser prxima al 5%

2.

Precisin (i)(d): 3%

3.

Nivel del confianza (seguridad): 95%

n = 203 personas del distrito de salud X


4.

Tamao de la poblacin de origen (poblacin atendida por el distrito de salud X)

n = 200 personas del distrito de salud X


Pita Fernndez S. Determinacin del tamao muestral. Cad Aten Primaria 1996; 3: 138-144.

Pita Fernndez S. Determinacin del tamao muestral. Cad Aten Primaria 1996; 3: 138-144.

C aptulo 3

Clculo del tamao muestral para contraste de hiptesis


1. Magnitud de la diferencia a detectar que tenga inters clnico.
- Comparacin de dos medias.
- Comparacin de dos proporciones: P1 y P2.
2. Aproximacin de los parmetros de la variable que se estudia (bibliografa o estudios
previos).
3. NIVEL DE CONFIANZA deseado o seguridad del estudio (generalmente 95%), que
corresponde a un valor de de 0,05 (riesgo de cometer un error alfa).
4. PODER ESTADSTICO (1- )(riesgo de cometer un error ).
5. Definir si la hiptesis va a ser unilateral o bilateral.
- Bilateral: cualquiera de los dos parmetros a comparar puede ser mayor o menor
que el otro (no hay direccin) (A B).
- Unilateral: cuando se considera que uno debe ser mayor que el otro (direccin de
las diferencias) (A < B).

Pgina 196

C aptulo 3

Prueba UNILATERAL: Se utiliza cuando se pretende determinar si el frmaco nuevo B


Prueba
UNILATERAL:
Se utiliza
cuando
se slo
pretende
determinar
el frmaco
nuevo
es ms eficaz
que
el clsico A,
es decir,
tan
interesa
unasi de
las direcciones
de la
B es ms eficaz que el clsico A, es decir, tan solo interesa una de las direcciones de
comparacin
(B > A), interesa
demostrar
queque
B sea
efectivo
la comparacin
(B > A), interesa
demostrar
B seams
ms efectivo
queque
A. A.
DISTRIBUCIN
NORMAL
TIPIFICADA (Z)
Valores de la distribucin normal
tipificada (Z) correspondientes al
valor del 5% en las pruebas
estadsticas unilaterales y bilaterales.
Las pruebas unilaterales especifica
la direccin de la diferencia.
Las pruebas bilaterales NO especifica
la direccin de la diferencia.

Una sola cola

Z 1-

Ho: o
Ha: o >

= 0,05

B>A

Z = 1.645
Dos colas

Z 1- /2

Ho: o =
Ha: o

AB

Z = - 1.96

Z = 1.96

Prueba BILATERAL: Se utiliza cuando se pretende determinar si dos frmacos

Prueba BILATERAL:
Seenutiliza
cuando
se pretende
determinar si dos frmacos A y B
A y B difieren
su efectividad
clnica
(A B)
difieren en su efectividad clnica (A B).

Pgina 197

C aptulo 3

Pruebas de contraste unilateral:


Riesgo en la toma de decisiones
Se utiliza cuando se pretende
determinar si el frmaco nuevo
B es ms eficaz que el clsico
A, es decir, tan solo interesa
una de las direcciones de la
comparacin (B > A)

Ho

Riesgo beta
error b

1 - = Nivel de confianza
Probabilidad de Ho cuando esta es cierta

Ha

Una sola cola


B>A
Riesgo alfa
= 0,05
Z = 1,645

1 - b = Potencia estadstica
Probabilidad de Ha cuando esta es cierta

Pgina 198

C aptulo 3

Pruebas de contraste bilateral:


Riesgo en la toma de decisiones
Se utiliza cuando se pretende determinar si dos frmacos A y B difieren en su
eficacia clnica (A B)

Dos colas

Riesgo beta
error b

B<A

Riesgo beta
error b

B>A

/2 = 0,025

/2 = 0,025

Z = - 1.96

Z = 1.96

Riesgo alfa = 0,05 se distribuye simtricamente a cada lado 0,025

Pgina 199

C aptulo 3

Pgina 200

Ejemplo de comparacin de clculo del tamao muestral para comparacin


de dos proporciones a una sola cola
Deseamos evaluar si el nuevo frmaco B es mejor que el tratamiento clsico A para el
alivio del dolor, para lo que diseamos un ensayo clnico. Sabemos por datos previos
(bibliografa) que la eficacia del frmaco A es prxima al 70% y consideramos clnicamente
relevante si el nuevo frmaco B alivia el dolor en un 90%. Nuestro nivel de riesgo alfa lo
fijamos en 0.05 (error =5%) y deseamos un poder estadstico (1- ) de un 80% (error
=20%). Cul es el volumen muestral?

B>A

Una sola cola


Z = 1.645

n = 48 pacientes
En cada grupo (A y B) precisamos 48 pacientes.
Pita Fernndez S. Determinacin del tamao muestral. Cad Aten Primaria 1996; 3: 138-144.

C aptulo 3

Pgina 201

Ejemplo de comparacin de clculo del tamao muestral para comparacin


de dos proporciones a dos colas.
Sabemos por datos previos (bibliografa) que la mortalidad del frmaco A es prxima al
31% comparada con el frmaco B que tiene una tasa de mortalidad del 40%. Nuestro nivel
de riesgo alfa lo fijamos en 0.05 (error =5%) y deseamos un poder estadstico (1- ) de
un 90% (error =10%). Cul es el volumen muestral?

Dos colas

Z = 1.96

BA

Necesitamos un total de 1184 pacientes, 592 para cada grupo (A y B).

C aptulo 3

Influencia de la magnitud del efecto a detectar y del poder estadstico en la


determinacin del tamao muestral (n1 y n2).
Comparacin de dos Prevalencias (proporciones) P1 y P2.
100%

P1 = 40% = 20%
P2 = 60%

Poder estadstico (1 )

90%

P1 = 40% = 15%
P2 = 55%

80%
70%
60%

P1 = 40% = 10%
P2 = 50%

50%
40%
30%
20%
10%
0%

50

100

150

200

250

300

Nmero de casos por grupo

350

400

450

500

Pgina 202

C aptulo 3

Pgina 203

Clculo del tamao de la muestra por software (ejemplo)


El clculo resulta an ms fcil, cuando se utiliza un software. Por ejemplo
utilizando el software gratuito PS: Power and Sample Size Program, tenemos
que introducir los valores correspondientes a:
1. Las tasa de mortalidad en los grupos que recibieron el tratamiento A y B
(0.31 y 0.40).
2. El nivel de significacin estadstica (ERROR ALFA del 5%) (p < 0.05) .
3. El poder estadstico del estudio (ERROR BETA del 10%) (0.90) asumido
para obtener el tamao muestral por cada grupo.

C aptulo 3

Pgina 204

C aptulo 3

Pgina 205

Ejemplo del clculo del tamao muestral para el clculo del coeficiente de
correlacin entre dos variables cuantitativas
Supongamos que se desea estudiar la asociacin entre la edad y el nivel de colesterol
entre los pacientes de un centro de salud. Se disea un estudio piloto en el que se
determinar mediante una analtica el colesterol en una muestra aleatoria de los pacientes
durante un periodo de tiempo prefijado, de los que tambin se registrar su edad. Se
obtiene un valor del coeficiente de correlacin lineal de Pearson entre la edad y el
colesterol de r=0,3. Aplicando las frmulas, con un NIVEL DE CONFIANZA del 95% (error
=5%) y un PODER ESTADSTICO del 80% (error =20%), se obtiene:
En este caso, se necesitara
incluir a 85 pacientes para
llevar a cabo el estudio.

Si, adems, en este ltimo caso se prev un 20% de posibles prdidas de informacin
durante la ejecucin del estudio, el tamao muestral se recalcula segn la expresin:
Es decir, se necesitara una
muestra de 107 pacientes para
llevar a cabo la investigacin.
Prtegas Daz S , Pita Fernndez S. Determinacin del tamao muestral para calcular la significacin del
coeficiente de correlacin lineal. Cad Aten Primaria 2001; 9: 209-211.

C aptulo 3

Frmulas para el clculo


del poder estadstico (1) en funcin del tipo de
diseo del estudio.

Clculo del poder estadstico


de un estudio.
Prtegas Daz S, Pita Fernndez S.
Unidad de Epidemiologa Clnica
y Bioestadstica. Complexo
Hospitalario-Universitario Juan
Canalejo. La Corua

Pgina 206

C aptulo 3

Frmulas para el clculo del poder estadstico (1-) en funcin del tipo de
diseo del estudio.

Clculo del poder estadstico de un estudio.


Prtegas Daz S, Pita Fernndez S.
Unidad de Epidemiologa Clnica y Bioestadstica. Complexo Hospitalario-Universitario Juan Canalejo.
La Corua

Pgina 207

C aptulo 3

n = Tamao muestral. En un estudio de casos y controles, n es el nmero de casos.


P1 = En un estudio transversal o de cohortes, proporcin de expuestos que
desarrollan la enfermedad. En un estudio de casos y controles, proporcin de casos
expuestos
P2 = En un estudio transversal o de cohortes, proporcin de NO expuestos que
desarrollan la enfermedad. En un estudio de casos y controles, proporcin de
controles expuestos
d = Valor mnimo de la diferencia a detectar entre dos medias
s2 = Varianza en el grupo control o de referencia
c = Nmero de controles por caso, en estudios caso-control
m = En un estudio de casos y controles, nmero de controles
OR = Valor aproximado del odds ratio a detectar
RR = Valor aproximado del riesgo relativo a detectar
r = Magnitud del coeficiente de correlacin a detectar

Pgina 208

C aptulo 3

Valores de los estadsticos Z ms frecuentemente utilizados en el clculo del tamao muestral


considerando el error y
Error

Seguridad (1 - )

Test unilateral
Z 1-

Test bilateral
Z 1- /2

0,05

95%

1,645

1,96

0,01

99%

2,326

2,576

Error

Poder estadstico (1 )

Z 1-

0,10

90%

0,10

1,282

0,20

80%

0,20

0,842

Pgina 209

C aptulo 3

Asociacin observada
p < 0,05

p > 0,1
Estadsticamente NO significativa

Estadsticamente significativa

AB

A=B
VP

FP

Falsa

Verdadera

(no existe asociacin)

Utilidad clnica

Error
Sesgo

Verdadera

VN

Sin inters prctico

Error

FN

Falsa
Comparacin
poco sensible

Nmero insuficiente de sujetos

Interpretacin de una asociacin (o diferencia) observada en un estudio

Sesgo

Pgina 210

C aptulo 3

Interpretacin de una asociacin (o diferencia)


observada en un estudio ERROR ALFA
Expedicin de pesca
La probabilidad de encontrar resultados FALSOS POSITIVOS FP (error alfa )
aumenta notablemente con el nmero de comparaciones injustificadas realizadas
entre las distintas variables durante el anlisis (ir de pesca).
Estudios que sin apoyarse en ninguna hiptesis a PRIORI (estrategia de anlisis),
consideran todas las variables de igual importancia (hiptesis a POSTERIORI),
analizndolas unos contra otras (sin criterio), esperando a ver que se encuentra

Pgina 211

C aptulo 3

Decisiones que se pueden tomar en un test de contraste


de hiptesis despus de conocer el valor de significacin
estadstica p
p < 0,05

AB

p 0,10

A=B

Se rechaza la hiptesis nula

No se puede rechazar la hiptesis nula

No parece que el azar pueda


explicarlo todo

No se puede descartar que el azar lo


explique todo

El EFECTO observado es mayor que


el ERROR

El EFECTO observado es similar que el


ERROR

Hay diferencias estadsticamente


significativas

NO hay diferencias estadsticamente


significativas

Existen evidencias a favor de la


hiptesis alternativa Ha, y por tanto
rechazamos la hiptesis nula Ho

NO existen evidencias a favor de la


hiptesis alternativa Ha, y por tanto
aceptamos la hiptesis nula Ho

Los lmites de 0,05 y 0,1 pueden ser considerados en cierto modo


arbitrarios y aproximados

Pgina 212

C aptulo 3

Materiales
Pacientes
1. Criterios de seleccin de la muestra (inclusin y exclusin).
2. Procedencia.
3. Tcnica de reclutamiento utilizada.
4. Tiempo empleado para reunir a todos los participantes.
5. Principales caractersticas de los pacientes.
- Edad.
- Sexo.
- Procedencia.
- Gravedad.
- Aos de evolucin de la enfermedad.
- Patologas asociadas...
6. Clculo de tamao muestral.

Pgina 213

C aptulo 4

Captulo 4
Publicacin Bioestadstica: Error y .
Evaluacin de pruebas diagnsticas.

Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Pgina 214

C aptulo 4

Pgina 215

Bioestadstica: Error y
Influencia de los errores y en la rentabilidad clnica de las
pruebas diagnsticas
Evaluacin de las pruebas diagnsticas

C aptulo 4

Evaluacin de las pruebas diagnsticas

- Exactitud (validez, efectividad o rentabilidad).


- Sensibilidad.
- Especificidad.
- Seguridad: valores predictivos.
- Valor predictivo positivo (VPP).
- Valor predictivo negativo (VPN).
- Razn de verosimilitud.
- Curvas roc.
- Reproductivilidad.
- Invasividad.
- Coste econmico (URV).

Pgina 216

Pgina 217

C aptulo 4

Hiptesis nula (Ho): No existen diferencias significativas en la eficacia clnica


de dos frmacos A y B (A = B)
Hiptesis alternativa (Ha): Existen diferencias en la eficacia clnica de dos
frmacos A y B (A B) A>B A<B
Realidad

Se produce un cierto solapamiento en las


distribuciones de probabilidad de la Ho y de
la Ha, en este solapamiento siempre aparece
el error y asumido, el cual ser mayor o
menor en funcin del resultado o diferencia
observada en nuestro estudio

Resultado
de la prueba
estadstica

p < 0,05
Acepto la Ha

p > 0,05
Acepto la Ho

Existe
diferencia
(Ha
verdadera)

No existe
diferencia
(Ho
verdadera)

No error
VP (1-)

Error tipo I
FP ( )

Error tipo II No error


FN ()
VN

Resultados de una prueba de significacin estadstica


Ho: hiptesis nula (no hay diferencias significativas)
X: distribucin de la diferencia cuando Ho es cierta
Y: distribucin de la diferencia cuando Ha es cierta
R: resultado (diferencia) observado en nuestro estudio

C aptulo 4

Relacin de los riesgos asociados a un test de hiptesis


unilateral (estadstico valor de la media):
Error tipo I (riesgo a) y tipo II (riesgo b)
Muestra:

cae en esta lnea:

Riesgo beta
error b

xx

cae en esta lnea:

Riesgo alfa
error 0,05
Significacin
estadstica

Regin
de aceptacin
H0
Regin de
aceptacin
H0
Regin de rechazo H1
Regin de rechazo Ha

x
Regin de
rechazo
H0
Regin
de rechazo
H

Regin de
aceptacin
H1
Regin
de aceptacin
H

Pgina 218

C aptulo 4

Riesgo alfa y riesgo beta


Se produce un cierto de la
Ho y de la Ha, en este
solapamiento siempre
aparece el error y
asumido, el cual ser
mayor o menor en funcin
del resultado o diferencia
observada en nuestro
estudio

Ho

Ha

Riesgo alfa
error 0,05
Significacin
estadstica

Riesgo beta
error b
Se acepta Ho
Se rechaza Ha

Se acepta Ha
Se rechaza Ho

Pgina 219

C aptulo 4

Error alfa versus error beta:


No se puede tener todo

b
ERROR BETA
FALSOS NEGATIVOS

a
ERROR ALFA
FALSOS POSITIVOS

Pgina 220

C aptulo 4

Error alfa versus error beta:


No se puede tener todo
a 1-5 %
ERROR ALFA
b 10-20 %
ERROR BETA
FALSOS NEGATIVOS

FALSOS POSITIVOS

Pgina 221

C aptulo 4

Pgina 222

Error alfa versus error beta:


No se puede tener todo
Hay que buscar un equilibrio entre los FALSOS POSITIVOS (error ) y los FALSOS
NEGATIVOS (error b).
Ho

error b
10%

Ho

error b
20%

Ha

error
(0,05)
Ha

error

(0,01)

Para un tamao muestral fijo (N= cte), no se pueden reducir a la vez ambos tipos de error.
Para reducir b, hay que aumentar el tamao muestral N.

C aptulo 4

Tipos de error en las pruebas diagnsticas


Realidad

Test de laboratorio

Enfermos

Sanos

Positivo
(+)
Hiptesis alternativa

VERDADEROS
POSITIVOS
VP
(1- )

FALSO POSITIVO
error
Error Muy grave

Negativo
(-)
Hiptesis nula

FALSO NEGATIVO
error
Error Menos grave

VERDADEROS
NEGATIVOS
VN

Pgina 223

C aptulo 4

Tipos de error en las pruebas diagnsticas


Tipos de error en las pruebas diagnsticas

Test de laboratorio
PSA

Realidad
Enfermos

Sanos

Positivo
(+)

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativo
(-)

FALSO NEGATIVO
FN

VERDADEROS
NEGATIVOS
VN

Pgina 224

C aptulo 4

Tipos de error en las pruebas diagnsticas


Tipos de error en las pruebas diagnsticas

Resultados de la prueba
diagnstica

Evento o enfermedad estudiada


Enfermos

Sanos

Total

Positivo
(+)

VERDADEROS
POSITIVOS
VP

FALSO
POSITIVO
FP

VP + FP

Negativo
(-)

FALSO NEGATIVO
FN

VERDADEROS
NEGATIVOS
VN

FN + VN

Total

VP + FN

FP + VN

SENSIBILIDAD =

VP
VP + FN

SENSIBILIDAD

Enfermos positivos
Total de ENFERMOS

Pgina 225

C aptulo 4

La sensibilidad de la prueba diagnstica

- Es la probabilidad de clasificar correctamente a un individuo enfermo.


- Es la probabilidad de que para un sujeto enfermo se obtenga en la prueba
un resultado positivo.
- Es la capacidad del test para detectar la enfermedad.
- Probabilidad de obtener un resultado positivo cuando el individuo tiene la
enfermedad.
- Mide su capacidad para detectar la enfermedad cuando est presente.
- Su valor depende del error BETA ().

Pgina 226

C aptulo 4

Tipos de error en las pruebas diagnsticas


Tipos de error en las pruebas diagnsticas

Resultados de la prueba
diagnstica

Evento o enfermedad estudiada


Enfermos

Sanos

Total

Positivo
(+)

VERDADEROS
POSITIVOS
VP

FALSO
POSITIVO
FP

VP + FP

Negativo
(-)

FALSO NEGATIVO
FN

VERDADEROS
NEGATIVOS
VN

FN + VN

Total

VP + FN

FP + VN

ESPECIFICIDAD

==

Sanos negativos
Total de SANOS

ESPECIFICIDAD =

VN
VN + FP

Pgina 227

C aptulo 4

Pgina 228

La especificidad de la prueba diagnstica

- Es la probabilidad de clasificar correctamente a un individuo sano.


- Es la probabilidad de que para un sujeto sano se obtenga un resultado
negativo.
- Es la capacidad del test para detectar a los sanos.
- Es la probabilidad de obtener un resultado negativo cuando el individuo no
tiene la enfermedad.
- Mide la capacidad para descartar la enfermedad cuando no est presente.
- Su valor depende del error ALFA ().

C aptulo 4

Pgina 229

Exactitud en las pruebas diagnsticas


- Es la principal cualidad clnica de una prueba diagnstica.
- Es la capacidad de una prueba diagnstica para clasificar correctamente a
los pacientes.
- Es la capacidad de una prueba diagnstica para clasificar correctamente
a los individuos en subgrupos clnicamente relevantes (enfermos y NO
enfermos).
- En su forma ms simple es la capacidad para distinguir entre dos estados de
salud (enfermos y NO enfermos).

EXACTITUD =

VP

VN

VP + FN + FP + VN

C aptulo 4

Exactitud en las pruebas diagnsticas

EXACTITUD =

VP

VN

VP + FN + FP + VN

SENSIBILIDAD

EXACTITUD =

ESPECIFICIDAD

ACIERTOS
ACIERTOS + FALLOS

Pgina 230

C aptulo 4

Tipos de error en las pruebas diagnsticas


Tipos de error en las pruebas
diagnsticas
Resultados
de la prueba
diagnstica

Evento o enfermedad estudiada


Enfermos

Sanos

Total

Positivo
(+)

VERDADEROS
POSITIVOS
VP

FALSO
POSITIVO
FP

VP + FP
(total de positivos)

Negativo
(-)

FALSO NEGATIVO
FN

VERDADEROS
NEGATIVOS
VN

FN + VN

Total

VP + FN

FP + VN

VPP =

VP
Total de POSITIVOS

VPP =

VP
VP + FP

Pgina 231

C aptulo 4

Pgina 232

Valor Predictivo Positivo (VPP) de la prueba diagnstica

- Es la probabilidad de padecer la enfermedad si se obtiene un resultado


positivo en el test.
- Se puede definir el VPP como la proporcin de resultados vlidos (VP) entre
todos resultados positivos de la prueba (VP + FP).
- Su valor depende del error ALFA () y de la POTENCIA ESTADSTICA.
- Su valor depende de la prevalencia (P) de la enfermedad; cuanto menor sea
la prevalencia menor ser el VPP y cuanto mayor sea la prevalencia mayor
ser el VPP.

C aptulo 4

Tipos de error en las pruebas diagnsticas


Tipos de error en las pruebas
diagnsticas
Resultados
de la prueba
diagnstica

Evento o enfermedad estudiada


Enfermos

Sanos

Total

Positivo
(+)

VERDADEROS
POSITIVOS
VP

FALSO
POSITIVO
FP

VP + FP
(total de positivos)

Negativo
(-)

FALSO NEGATIVO
FN

VERDADEROS
NEGATIVOS
VN

FN + VN
(total de
negativos)

Total

VP + FN

FP + VN

VPN =

VN
Total de NEGATIVOS

VPN =

VN
VN + FN

Pgina 233

C aptulo 4

Pgina 234

Valor Predictivo Negativo (VPN) de la prueba diagnstica

- Es la probabilidad de que un sujeto con un resultado negativo en la prueba


est realmente sano.
- El VPN es la proporcin de resultados vlidos (VN) entre todos los
resultados negativos (VN + FN).
- Su valor depende del error BETA ().
- Su valor depende de la prevalencia (P) de la enfermedad en estudio
Cuanto menor sea la prevalencia, mayor ser el VPN, y cuanto mayor sea la
prevalencia, menor ser el VPN.

C aptulo 4

Prevalencia de la enfermedad

Es la frecuencia con la que se presenta una determina enfermedad en una


poblacin definida en un momento dado.

PREVALENCIA =

PREVALENCIA =

VP

FN

VP + FP + FN + VN
ENFERMOS
ENFERMOS + SANOS

Pgina 235

C aptulo 4

Prevalencia de la enfermedad

PREVALENCIA =

VP

FN

VP + FP + FN + VN

PREVALENCIA = VALOR

ENFERMOS

PREDICTIVO
ENFERMOS
POSITIVO (VPP)

VALOR
PREDICTIVO
SANOS
NEGATIVO (VPN)

Los valores predictivos (VPP y VPN) dependen de la prevalencia de la


enfermedad en estudio.

Pgina 236

C aptulo 4

EXACTITUD

SENSIBILIDAD

ESPECIFICIDAD

VALOR PREDICTIVO
NEGATIVO (VPN)

VALOR PREDICTIVO
POSITIVO (VPP)

PREVALENCIA

Pgina 237

C aptulo 4

Pgina 238

Relacin entre la prevalencia y el valor predictivo positivo


(VPP)
Prevalencia
de la
enfermedad

Resultado
prueba
diagnstica

Enfermos

Sanos
(No enfermos)

Total

VPP

1%

99

495

594

9404

9406

15%
(99/595)

Total

100

9900

10000

495

475

970

9025

9030

Total

500

9500

10000

5%

SENSIBILIDAD DIAGNSTICA = 99%

51%
(495/970)

ESPECIFICIDAD DIAGNSTICA = 95%

C aptulo 4

Relacin entre la prevalencia y el valor predictivo

Valor predictivo (%)

VALOR PREDICTIVO POSITIVO (VPP)

VALOR PREDICTIVO NEGATIVO (VPN)

Prevalencia de la enfermedad

Pgina 239

C aptulo 4

Razn de verosimilitud

RV + =

RV + =

SENSIBILIDAD
1 - ESPECIFICIDAD

Tasa de VP (%)
Tasa de FP (%)

Pgina 240

C aptulo 4

Cul es la probabilidad de que un paciente que acude a


la consulta tenga un carcinoma de prstata si el PSA (+)
([PSA]s > 4 ng/ml)?
Variable PREDICTORA
PSA (+)

Variable RESULTADO
Carcinoma de prstata

VALOR PREDICTIVO POSITIVO (VPP)

Es la probabilidad de que un paciente tenga un carcinoma de prstata (CP) una vez que el test (PSA) ha
dado positivo ([PSA] > 4 ng/ml).

Pgina 241

C aptulo 4

Cul es la probabilidad de que un paciente que acude a la


consulta NO tenga un carcinoma de prstata si el PSA (-)
([PSA] < 4 ng/ml)?

VALOR PREDICTIVO NEGATIVO (VPN)

Es la probabilidad de que un individuo sano NO tenga un carcinoma de prstata (CP) una vez que el test
(PSA) ha dado negativo ([PSA] < 4 ng/ml).

Pgina 242

C aptulo 4

Pgina 243

Cul es la probabilidad de que un paciente diagnosticado


de carcinoma de prstata presente un PSA (+) ([PSA] > 4
ng/ml)?
Variable PREDICTORA
Carcinoma de prstata

Variable RESULTADO
PSA (+) ([PSA] > 4 ng/ml)

SENSIBILIDAD DIAGNSTICA

Es la probabilidad de que el test (PSA) sea positivo entre los individuos realmente enfermos (carcinoma de
prstata).

C aptulo 4

Pgina 244

Cul es la probabilidad de que un paciente sin carcinoma


de prstata (CP) presente un PSA (-) ([PSA] < 4 ng/ml)?

ESPECIFICIDAD DIAGNSTICA

Es la probabilidad de que el test (PSA) sea negativo entre los individuos realmente no enfermos (sin cncer
de prstata).

C aptulo 4

Pgina 245

Cul es la probabilidad de que un valor de PSA patolgico


([PSA] > 4 ng/ml)? sea X veces ms probable en un paciente
con carcinoma de prstata (CP) que en otro sujeto sin cncer?

RAZN DE VEROSIMILITUD (RV+)

Es la probabilidad de que un resultado elevado del test (PSA) aparezca en los pacientes con carcinoma de
prstata frente a los individuos realmente no enfermos (sin cncer de prstata).

C aptulo 4

Pregunta de investigacin
Qu utilidad clnica tiene el tacto rectal en el diagnstico del
carcinoma de prstata (CP) en una muestra de pacientes con
sospecha de CP que acuden a una consulta de Urologa?
Objetivo: Evaluacin del tacto rectal en el diagnstico del CP en una
consulta de urologa.
Tcnica analtica a valuar
TACTO RECTAL

Tcnica de referencia
(patrn de oro)
BIOPSIA PROSTTICA mediante
ecografa transrectal

Cul es el test estadstico ms acertado?


Pita Fernndez S, Prtegas Daz S. Pruebas diagnsticas. Cad Aten Primaria 2003; 10: 120-124.

Pgina 246

C aptulo 4

Tipos de error en las pruebas diagnsticas


Tipos de error en las pruebas diagnsticas

TACTO RECTAL

Tcnica de referencia
(BIOPSIA transrectal ecodirigida)
POSITIVA

NEGATIVA

Positivo
(+)

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativo
(-)

FALSO NEGATIVO
FN

VERDADEROS
NEGATIVOS
VN

Pgina 247

C aptulo 4

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

SENSIBILIDAD =

SENSIBILIDAD =

VP
VP + FN
634
634 + 487

= 56,5%

Pgina 248

C aptulo 4

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

ESPECIFICIDAD =

ESPECIFICIDAD =

VN
VN + FP
1251
1251 + 269

= 82,3%

Pgina 249

C aptulo 4

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

EXACTITUD =

EXACTITUD =

VP + VN
VP + FN + FP + VN
634 +

1251

634 + 487 + 269 + 1251

= 71,4 %

Pgina 250

C aptulo 4

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

VPP =

VP
VP + FP

VPP =

634
634 + 269

= 70,2%

La probabilidad de tener un CP es del 70% cuando el tacto rectal es positivo.

Pgina 251

C aptulo 4

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

VPN =

VN
VN + FN

VPN =

1251
1251 + 487

= 72,0%

La probabilidad de NO tener un CP es de tan slo el 72% cuando el tacto rectal es negativo.


Como la prueba tiene un VPN bajo, un resultado negativo del tacto rectal slo permite descartar el
diagnstico de CP con una probabilidad del 72%.

Pgina 252

C aptulo 4

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

PREVALENCIA =

PREVALENCIA =

VP + FN
VP + FP + FN + VN
634

487

634 + 269 + 487 + 1251

= 42,4 %

Pgina 253

C aptulo 4

Pgina 254

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)


TACTO RECTAL

positiva (+)

negativa (-)

Total

Positivo (+)

634

269

903

Negativo (-)

487

1251

1738

Total

1121

1520

2641

RV + =

SENSIBILIDAD
1

ESPECIFICIDAD

RV + =

0,565
1

0,823

= 3,2

Un tacto rectal anormal (+) es 3 veces ms probable en un paciente con CP que en otro sujeto sin cncer.

C aptulo 4

Pregunta de investigacin
Qu utilidad clnica tiene la tira reactiva en orina en el
diagnstico de la infeccin del tracto urinario (ITU)?
Objetivo: Evaluacin de la TIRA REACTIVA en el diagnstico de la ITU.
Tcnica analtica a valuar
TIRA REACTIVA
(orina)

Tcnica de referencia
(patrn de oro)
CULTIVO
(orina)

Cul es el test estadstico ms acertado?

Latorre C, Noguero M, Mira A. Evaluacin de la tira reactiva para el diagnstico de infeccin urinaria en
nios y adultos. Med Clin (Barc) 2001; 116: 286-289.

Pgina 255

C aptulo 4

Tipos de error en las pruebas diagnsticas


Tipos de error en las pruebas diagnsticas

Test de laboratorio
TIRA REACTIVA
orina

Tcnica de referencia
(CULTIVO)
POSITIVO

NEGATIVO

Positiva
(+)

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativa
(-)

FALSO NEGATIVO
FN

VERDADEROS
NEGATIVOS
VN

Pgina 256

C aptulo 4

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

SENSIBILIDAD =

SENSIBILIDAD =

VP
VP + FN
86
86

+ 20

= 81,1%

Pgina 257

C aptulo 4

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

ESPECIFICIDAD =

ESPECIFICIDAD =

VN
VN + FP
548
548

+ 433

= 55,9%

Pgina 258

C aptulo 4

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

EXACTITUD =

EXACTITUD =

VP + VN
VP + FN + FP + VN
86

548

86 + 20 + 433 + 548

= 58,3%

Pgina 259

C aptulo 4

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

VPP =

VP
VP + FP

VPP =

86
86 + 433

= 16,6%

La probabilidad de tener una ITU es de tan slo el 17% cuando la tira reactiva es positiva.

Pgina 260

C aptulo 4

Pgina 261

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

VPN =

VN
VN + FN

VPN =

548
548 + 20

= 96,5%

La probabilidad de NO tener una ITU es del 96,5% cuando la tira reactiva es negativa.
Como la prueba tiene un VPN alto, un resultado negativo de la tira urinaria descarta el diagnstico de ITU
con una probabilidad del 96,5%.

C aptulo 4

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

PREVALENCIA =

PREVALENCIA =

VP + FN
VP + FP + FN + VN
86

20

86 + 433 + 20 + 548

= 9,7 %

Pgina 262

C aptulo 4

INFECCIN DEL TRACTO URINARIO (ITU)


Tira reactiva

SI

NO

Total

Positva (+)

86

433

519

Negativa (-)

20

548

568

Total

106

981

1087

RV + =

RV + =

SENSIBILIDAD
1

ESPECIFICIDAD

0,811
1

0,559

= 1,84

Una tira reactiva anormal (+) es casi 2 veces ms probable en un paciente con ITU que en otro sujeto sin
infeccin.

Pgina 263

C aptulo 4

Pregunta de investigacin
Qu utilidad clnica tienen los niveles de ferritina srica
en el diagnstico de la anemia ferropnica?
Objetivo: Evaluacin de la FERRITINA en el diagnstico de la anemia
ferropnica.
Tcnica analtica a valuar
FERRITINA
(srica)

Tcnica de referencia
(patrn de oro)
ANEMIA FERROPNICA

Cul es el test estadstico ms acertado?

DL Sackett. Epidemiologa clnica. Buenos Aires, Editorial Mdica Panamericana, 1994.

Pgina 264

C aptulo 4

Tipos de error en las pruebas diagnsticas


Tipos de error en las pruebas diagnsticas

Test de laboratorio
FERRITINA
srica

Realidad
Anemia ferropnica

Sanos

Positivo
(+)
FERRITINA
BAJA

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativo
(-)
FERRITINA
NORMAL

FALSO NEGATIVO
FN

VERDADEROS
NEGATIVOS
VN

Pgina 265

C aptulo 4

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

SENSIBILIDAD =

SENSIBILIDAD =

VP
VP +

FN

731
731 + 78

= 90,3%

Si una prueba tiene una sensibilidad alta, un resultado negativo descarta el diagnstico.

Pgina 266

C aptulo 4

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

ESPECIFICIDAD =

ESPECIFICIDAD =

VN
VN + FP
1500
1500 + 270

= 84,7%

Si una prueba tiene una especificidad alta, un resultado positivo confirma el diagnstico.

Pgina 267

C aptulo 4

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

EXACTITUD =

EXACTITUD =

VP + VN
VP + FN + FP + VN
731 + 1500
731 + 78 + 270 + 1500

= 86,5%

Una exactitud elevada permite distinguir con un mnimo error entre dos estados de salud.

Pgina 268

C aptulo 4

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

VPP =

VP
VP + FP

VPP =

731
731 + 270

= 73%

La probabilidad de tener una anemia ferropnica es del 73% cuando la ferritina srica es baja.

Pgina 269

C aptulo 4

Pgina 270

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

VPN =

VN
VN + FN

VPN =

1500
1500 + 78

= 95,1%

La probabilidad de NO tener una anemia ferropnica es del 95,1% cuando la ferritina srica es normal.
Como la prueba tiene un VPN alto, una ferritina normal descarta el diagnstico de anemia ferropnica con
una probabilidad del 95,1%.

C aptulo 4

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

PREVALENCIA =

PREVALENCIA =

VP + FN
VP + FP + FN + VN
731

78

731 + 270 + 78 + 1500

= 31%

Pgina 271

C aptulo 4

Pgina 272

ANEMIA FERROPNICA
FERRITINA

SI

NO

Total

BAJA (+)

731

270

1001

NORMAL (-)

78

1500

1578

Total

809

1770

2579

RV + =

RV + =

SENSIBILIDAD
1

ESPECIFICIDAD

0,903
1

0,847

= 5,9

Una ferritina baja es casi 6 veces ms probable en un paciente con anemia ferropnica que en otro sujeto
sin anemia ferropnica.

C aptulo 4

Pregunta de investigacin
Qu utilidad clnica tiene el ttulo srico de anticuerpos
antinucleares en el diagnstico de enfermedades autoinmunes?
Objetivo: Evaluacin del ttulo de ANA en el diagnstico de diferentes
enfermedades autoinmunes.
Tcnica analtica a valuar
ANA (IFI)

Tcnica de referencia
(patrn de oro)
ENFERMEDADES
AUTOINMUNES

Cul es el test estadstico ms acertado?

Pgina 273

C aptulo 4

Tipos de error en las pruebas diagnsticas


Tipos de error en las pruebas diagnsticas

Test de laboratorio
ANA
(IFI)

Realidad
Enfermedad autoinmune

Sanos

Positivo
(+)

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativo
(-)

FALSO NEGATIVO
FN

VERDADEROS
NEGATIVOS
VN

Pgina 274

C aptulo 4

Razn de verosimilitud
Cocientes de probabilidades

RV + =

RV + =

SENSIBILIDAD
1 - ESPECIFICIDAD
Tasa de VP (%)
Tasa de FP (%)

Pgina 275

C aptulo 4

Grupos de estudio

Razn de verosimilitud (+) (cociente de probabilidades positivo)


Ttulo 1/40

Ttulo 1/80

Ttulo 1/160

Ttulo 1/320

LES (n= 38)

3,1

7,3

18,9

26,1

ESP (n= 37)

3,2

7,1

17,3

25,1

SS (n= 37)

2,7

5,7

14,7

21,3

AR (n= 38)

1,5

2,8

2,7

0,81

RPB (n= 37)

1,2

1,7

1,5

1,2

Sanos (n=120)

1,0

1,0

1,0

1,0

La razn de verosimilitud positivo (RV+) o cociente de probabilidad (CP)


positivo (sensibilidad dividida por el complementario de la especificidad)
es una medida que calcula cunto ms probable es que un resultado
positivo de una prueba (ANA) se presente en un sujeto enfermo (EAI)
frente a uno sano.
La razn de verosimilitud negativo (RV-) o cociente de probabilidad (CP)
negativo (complementario de la sensibilidad dividida por la especificidad)
relaciona la probabilidad de que un resultado negativo de una prueba se
presente en un enfermo frente a un sano.

Pgina 276

C aptulo 4

Pgina 277

Razn de verosimilitud
Cocientes de probabilidades

RV +

Ttulo 1/40
Ttulo 1/80
Ttulo 1/160
Ttulo 1/320
Camps Garca MT, Muoz Rocan N, Calvo de Mora A, De Ramn Garrido E. Los cocientes de probabilidad
como medida de la utilidad de la determinacin de anticuerpos antinucleares por inmunofluorescencia
indirecta en la clnica. Aplicacin de los resultados de la investigacin clnica. Med Clin (Barc)1999;113: 476.

C aptulo 4

Tipos de error en las pruebas diagnsticas


Tipos de error en las pruebas diagnsticas

Test de laboratorio
FERRITINA
IST

Realidad
Hemocromatosis

Sanos

Positivo
(+)
FERRITINA alta
IST alto

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativo
(-)
FERRITINA normal
IST normal

FALSO NEGATIVO
FN

VERDADEROS
NEGATIVOS
VN

Pgina 278

C aptulo 4

Pgina 279

Mutacin C282Y

91,3
97
96
90

86
IST > 55%

88

90

92

Ferritina > 300 ng/ml varones

94

96

Ferritina > 200 ng/ml mujeres

98
IHH > 1,9

Genotypic/phenotypic correlations in genetic hemochromatosis: evolution of diagnostic criteria.Adams PC,


Chakrabarti S. Gastroenterology. 1998 Feb;114(2):319-23.

C aptulo 4

Pgina 280

Valoracin conjunta del IST y ferritina en el screening de la


hemocromatosis

IST (-) y Ferritina (-)


IST (+) y Ferritina (+)

92

93

97

94

94
Sensibilidad

95

96

valor predictivo negativo

Holman JR. Hereditary hemochromatosis. J Fam Pract 1997; 44: 304-308.

97

C aptulo 4

Pruebas diagnsticas en el cncer de prstata

FAP
PSA
Cociente
PSA libre/ PSA total
Tacto rectal
Citologa aspiracin
Biopsia prosttica mediante
ecografa transrectal

Pgina 281

C aptulo 4

Pruebas diagnsticas:
Mala rentabilidad diagnstica.
Baja sensibilidad y especificidad (FAP)
Sanos

Enfermos

HPB

Cncer Prstata

FN

error b

FP

error

Niveles de FAP

Pgina 282

C aptulo 4

Pruebas diagnsticas:
Buena rentabilidad diagnstica.
Equilibrio entre sensibilidad y especificidad (PSA)

HPB
Cncer Prstata

Niveles de PSA (ng/ml)

error b

error

Pgina 283

C aptulo 4

Pruebas diagnsticas:
Excelente rentabilidad diagnstica.
Mxima sensibilidad y especificidad (Cociente PSAlibre/total)
Sanos

Enfermos

HPB

Cncer Prstata

error b

error

Cociente PSAlibre/total

Pgina 284

C aptulo 4

Situacin ideal de las pruebas diagnsticas:

Frecuencia

Mxima sensibilidad y especificidad

HPB
Sanos

Su Negatividad indican
siempre la ausencia de la
enfermedad
Especificidad ~ 100%

Cncer Prstata
Enfermos

Su Positividad indican
siempre la presencia de la
enfermedad
Sensibilidad ~ 100%

Pgina 285

C aptulo 4

Situacin real de las pruebas diagnsticas:

Frecuencia

PSA - Buen equilibrio entre sensibilidad y especificidad

HPB

Sanos

Cncer Prstata
Enfermos

Concentracin PSA (ng/ml)

Sensibilidad ~ 61%
Especificidad ~ 90%

Zona gris / Zona indeterminada

Pgina 286

C aptulo 4

Pruebas diagnsticas a evitar:


Fosfatasa cida prosttica
Mal equilibrio entre sensibilidad y especificidad

Frecuencia

Baja Especificidad

HPB
sanos

Cncer Prstata
enfermos

Concentracin FAP

Sensibilidad ~ 60-70%
Especificidad ~ 40-50%

Zona gris / Zona indeterminada

Pgina 287

C aptulo 4

Eleccin del punto de corte

Frecuencia

Punto de corte ideal

HPB

Cncer Prstata
Enfermos

Sanos

Especificidad = 100%

Su Negatividad indican
siempre la ausencia de la
enfermedad

Xideal

Sensibilidad = 100%

Su Positividad indican
siempre la presencia de la
enfermedad

Pgina 288

C aptulo 4

Eleccin del punto de corte

Frecuencia

Punto de corte real

HPB

Cncer Prstata
Enfermos

Sanos

Concentracin PSA (ng/ml)

Las pruebas
pruebas diagnosticas
Las
diagnsticasno
notienen
un soloun
parsolo
sensibilidad/especificidad
tienen
par sensibilidad/
especificidad
(S/E), sino
(S/E), sino muchos,
uno por cada
muchos,
uno
por
cada
nivel
nivel de decisin o punto
dedecorte
decisin
o
punto
de
corte
que
que se adopte
se adopte.

Sensibilidad ~ 61%
Especificidad ~ 90%

Zona gris
Zona indeterminada

Pgina 289

C aptulo 4

Aumento del valor del punto de corte

Frecuencia

Aumentar la especificidad

HPB
sanos

Concentracin PSA (ng/ml)

Sensibilidad ~ 30%
Especificidad 99%

enfermos

Cncer Prstata

10

Para cualquier prueba en la que la distribucin de los


resultados de los grupos sano y enfermo se solapen,
existe un equilibrio entre sensibilidad y especificidad.
Ambas varan en direcciones opuestas: si se
AUMENTA el punto de corte disminuye la sensibilidad,
y aumenta la especificidad.

Pgina 290

C aptulo 4

Disminucin del valor del punto de corte

Frecuencia

Aumentar la sensibilidad

Cncer Prstata

HPB

enfermos

sanos

1,0 4.0

Sensibilidad 92%
Especificidad ~ 35%

Concentracin PSA (ng/ml)

Para cualquier prueba en la que la distribucin de los


resultados de los grupos sano y enfermo se solapen,
existe un equilibrio entre sensibilidad y especificidad.
Ambas varan en direcciones opuestas: si se
DISMINUYE el punto de corte aumenta la
sensibilidad, y disminuye la especificidad.

Pgina 291

C aptulo 4

PSA: ejemplo de error alfa (FP) y error beta (FN)

Error b

Error

PUNTO DE CORTE = 4 ng/ml


- Buena sensibilidad a la hora de detectar los CP
- Pero existe un nmero elevado de falsos positivos (HBP) > baja especificidad

Pgina 292

C aptulo 4

Sensibilidad y especificidad diagnstica:


Pruebas en el Cncer de Prstata
Prueba

Patrn de oro
(tcnica de
referencia)

FAP

56%

94%

PSA

61%

90%

Biopsia de la
prstata mediante
Ecografa
transrectal

PSA libre/PSA total

69%

95%

Examen rectal

56%

82%

Citologa aspiracin

55%

91%

Pgina 293

C aptulo 4

Pgina 294

Construccin de la curva ROC para cada prueba diagnstica


En el eje Y de coordenadas se sita la sensibilidad o fraccin de verdaderos positivos, calculada en los enfermos

1
SENSIBILIDAD DIAGNSTICA

La curva ROC es un
grfico que muestra todos
los pares posibles
sensibilidad/especificidad
resultantes de la variacin
continua de los puntos de
corte en todo el rango de
resultados observados.
La diagonal muestra por tanto
la peor situacin posible.

0
0

1 ESPECIFICIDAD
(Falsos positivos)

En el eje X se sita la fraccin de FP o 1 - especificidad, definida como 1 E = FP/VN + FP y calculada en


los no enfermos (sanos).

C aptulo 4

Diagrama de la curva ROC de la prueba diagnstica A

SENSIBILIDAD DIAGNSTICA

A
Las curvas ROC son los mejores ndices
de la efectividad, rentabilidad o exactitud
diagnstica y proporcionan un criterio
unificador en el proceso de evaluacin de
una prueba, y de comparacin simultnea
de varias pruebas diagnsticas.

0
0

1 ESPECIFICIDAD
(Falsos positivos)

Pgina 295

C aptulo 4

Diagrama de la curva ROC de la prueba diagnstica B

SENSIBILIDAD DIAGNSTICA

La diagonal muestra la peor


situacin posible.

El rea bajo la curva ROC es un


ndice de la EXACTITUD o valor
global de la prueba: la exactitud
mxima correspondera a un valor
del rea de 1 y la mnima de 0.5

0
0

1 ESPECIFICIDAD
(Falsos positivos)

Pgina 296

C aptulo 4

Diagrama de la curva ROC del PSA

Gann PH, Hennekens CH, Stampfer MJ. A prospective evaluation of plasma prostate.specific antigen for
detection of prostatic cancer. JAMA. 1995; 273: 289-294.

Pgina 297

C aptulo 4

Med Clin (Barc) 2006;127:41-6

Pgina 298

C aptulo 4

Pgina 299

C aptulo 4

Pgina 300

Introduccin (fragmento del texto)


Objetivos
El objetivo fundamental de este estudio es valorar la utilidad de la calprotectina fecal
(CPF) para predecir la presencia de una colonoscopia patolgica y, secundariamente,
analizar su uso para discriminar entre diferentes enfermedades orgnicas y correlacionar
sus valores con el grado de actividad clnica, endoscpica e histolgica en pacientes con
enfermedad inflamatoria intestinal (EII).

C aptulo 4

Pregunta de investigacin
Qu utilidad clnica tienen los niveles de calprotectina fecal de
la actividad de la enfermedad inflamatoria intestinal?
Tcnica analtica a valuar
Calprotectina fecal

Tcnica de referencia
(patrn de oro)
Colonoscopia: ndice de actividad
de la enfermedad inflamatoria
intestinal

Pgina 301

C aptulo 4

Pgina 302

Resultados (fragmento del texto)

La curva ROC mostr que el valor de CPF de 217 mg/kg fue el mejor punto de corte para
discriminar a los pacientes con enfermedad orgnica en colon. A partir de estos datos,
obtuvimos una sensibilidad de la medida de CPF del 85%, una especificidad del 81%, un
valor predictivo positivo del 64% y un valor predictivo negativo del 93%, respectivamente
(p < 0,001).
Valor
Sensibilidad

85%

Especificidad

81%

Valor predictivo positivo

64%

Valor predictivo negativo

93%

C aptulo 4

Pgina 303

Discusin (fragmento del texto)

En el presente estudio, la CPF ha mostrado ser una prueba altamente sensible para
detectar a pacientes con CCR y EII utilizando un punto de corte de 217 g/g.
La eleccin de un punto de corte ptimo debera realizarse a partir de un procedimiento
de referencia estndar, lo que en pacientes con dolor abdominal y diarrea implicar un
estudio gastrointestinal completo. De todas formas, siempre es aconsejable utilizar puntos
de corte ms bajos porque lo que debemos pretender con esta prueba es seleccionar a los
pacientes que requieren un estudio endoscpico posterior.

C aptulo 4

MITO 1: La sonrisa de la esfinge

Me parece acertada la eleccin de la curva ROC. Sin embargo


Por qu no has incluido el grfico de la curva?
Cul es el rea de la curva ROC y su IC95%?
En la bibliografa existen datos de curvas ROC que dan datos inferiores de rentabilidad
diagnstica, que no coinciden con lo presentados por Garca Snchez et al.
Cmo justificas esas diferencias?

Pgina 304

C aptulo 4

Pgina 305

Diagrama de la curva ROC de la calprotectina fecal

S = 85%
S = 70%

E = 65%

E = 85%

Tibblea J et al. Faecal calprotectin and faecal occult blood tests in the diagnosis of colorectal carcinoma and
adenoma. Gut 2001;49:402-408.

C aptulo 4

Pgina 306

Interpretacin de Hanley y McNeil del rea bajo la curva


ROC
- El rea bajo la curva (ABC) ROC es una medida global de la exactitud de una prueba
diagnstica.
- Se define como la probabilidad de clasificar correctamente un par de individuos sano
y enfermo, seleccionados al azar de la poblacin, mediante los resultados obtenidos al
aplicarles la prueba diagnstica.
- Es la probabilidad de que el resultado de la prueba se presente ms elevado en el
paciente enfermo
rea bajo la curva ROC = Probabilidad (X enfermo > X sano)
- En el ejemplo del PSA anterior un rea de 0,83 significa que un individuo seleccionado al
azar del grupo de enfermos tendr el 83% de las veces un valor de PSA cuantitativamente
mayor que el PSA de un individuo elegido al azar del grupo no enfermo (sanos).

Hanley JA, McNeil BJ. The meaning and use of the area under a Receiver Operating Characteristic (ROC)
Curve. Radiology 1982; 143: 29-36.

C aptulo 4

Pgina 307

Interpretacin de Swets del rea bajo la curva ROC


- El rea bajo la curva ROC es siempre mayor o igual que 0,5. Toma valores comprendidos
entre 0,5, si no existen diferencias en la distribucin de resultados de la prueba entre
los grupos enfermo y sano, y 1,0, cuando existe separacin perfecta entre las dos
distribuciones.
- Swets interpreta el valor del rea de la siguiente manera:
- Entre 0,5 y 0,7 indican baja exactitud
- Entre 0,7 y 0,9 pueden ser tiles para algunos propsitos
- Valores mayor de 0,9 indica alta exactitud.
- La capacidad de discriminacin de la prueba diagnstica puede evaluarse estimando el
intervalo de confianza del rea de la curva ROC. Si el intervalo no incluye el valor 0,5 la
prueba es capaz de discernir entre enfermos y sanos.
- En el ejemplo del PSA anterior el rea de 0,83 debe ser interpretado que la prueba puede
ser til en algunas situaciones clnicas, pero no es til por ejemplo, para realizar programas
de screening de la poblacin en bsqueda del cncer de prstata en la poblacin general.

Swets JA. Measuring the accuracy of diagnostic systems. Science 1988; 240: 1.285-1.293.

C aptulo 4

Comparacin del rea bajo la curva:


Prueba A versus prueba B

SENSIBILIDAD DIAGNSTICA

1
A

El rea de la curva ROC es la probabilidad


de clasificar correctamente un par de
individuos sano y enfermo, seleccionados al
azar de la poblacin en estudio, mediante los
resultados obtenidos al aplicarles la prueba
diagnstica.

El rea bajo la curva ROC es el mejor indicador de la


capacidad predictiva del la prueba, y permite la
comparacin entre diferentes pruebas diagnsticas.

0
0

1 ESPECIFICIDAD
(Falsos positivos)

Pgina 308

C aptulo 4

Comparacin del rea bajo la curva:


Prueba A versus prueba B
1
SENSIBILIDAD DIAGNSTICA

A = REA de la curva A
A

B = REA de la curva B
Qu prueba diagnstica (A versus
B) presenta una mayor rentabilidad,
efectividad, exactitud o valor global?
Estadstico Z de Hanley y McNeil (1983)

0
0

1 ESPECIFICIDAD
(fraccin de Falsos positivos)

Pgina 309

C aptulo 4

Pgina 310

Comparacin del rea de las curvas ROC en muestras


independientes
Z=

( A 1 A 2)
( EEA 1 )2 + (EEA 2 )2

A1 = rea bajo la curva ROC de la tcnica 1


A 2 = rea bajo la curva ROC de la tcnica 2
EEA 1 = error estndar del rea bajo la curva ROC de la tcnica 1
EEA 2 = error estndar del rea bajo la curva ROC de la tcnica 2
Si el estudio se realiza en grupos INDEPENDIENTES, la comparacin de reas mediante mtodos
estadsticos es directa. Si se utilizan datos APAREADOS o dependientes es necesario calcular previamente
la correlacin r entre las pruebas coeficiente de correlacin entre ambas tcnicas para muestras
independientes vale cero (r = 0).

C aptulo 4

Comparacin del rea de las curvas ROC en muestras


apareadas
Z=

( A 1 A 2)
( EEA 1 )2 + (EEA 2 )2

2 r * EEA 1 * EEA 2

A1 = rea bajo la curva ROC de la tcnica 1


A 2 = rea bajo la curva ROC de la tcnica 2
EEA 1 = error estndar del rea bajo la curva ROC de la tcnica 1
EEA 2 = error estndar del rea bajo la curva ROC de la tcnica 2
r = coeficiente de correlacin entre las reas de ambas tcnicas para
muestras dependientes

Pgina 311

C aptulo 4

Comparacin del rea bajo la curva: prueba A


versus prueba B
B

0,9

SENSIBILIDAD DIAGNSTICA

0,8

0,7
0,6
0,5
0,4
0,3

Qu prueba diagnstica (A versus B)


presenta una mayor rentabilidad,
efectividad, exactitud o valor global?

0,2
0,1
0

0,1 0,2

0,3

0,4

0,5

0,6

0,7

1 ESPECIFICIDAD
(fraccin de Falsos positivos)

0,8 0,9 1

Dos curvas ROC (A y B) con


igual rea. Sin embargo,
estas dos curvas ROC no
son idnticas. La prueba B
es superior a la prueba
A en el rango alto de falsos
positivos (o intervalo de
alta sensibilidad), mientras
que en la zona baja de
falsos negativos (intervalo
de baja sensibilidad) la
prueba A es superior a la B

Pgina 312

C aptulo 4

Pregunta de investigacin
Qu utilidad clnica tienen los niveles de urea en sangre
en el diagnstico de la insuficiencia renal?
Objetivo: Evaluacin de la uremia en el diagnstico de la insuficiencia
renal.
Tcnica analtica a valuar
Uremia (mg/dl)

Tcnica de referencia
(patrn de oro)
Insuficiencia renal

Cul es el test estadstico ms acertado?

Pgina 313

C aptulo 4

Tipos de error en las pruebas diagnsticas


Tipos de error en las pruebas diagnsticas

Enfermedad en estudio

Valor del punto de corte 90 mg/dl

Insuficiencia renal

No enfermos

Test de laboratorio
uremia

Positivo
(+)
Uremia > 90 mg/dl

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativo
(-)
Uremia 90 mg/dl

FALSO NEGATIVO
FN

VERDADEROS
NEGATIVOS
VN

Pgina 314

C aptulo 4

VN

FP

Individuos SIN
Insuficiencia renal
Uremia mg/dl

300 mg/dl

Pacientes
Insuficiencia renal
FN

VP
Punto de corte
optimo 90 mg/dl

Pgina 315

C aptulo 4

Individuos SIN
Insuficiencia renal

Frecuencia

Pacientes con
Insuficiencia renal

50

100

150

200

Uremia mg/dl

Punto de corte optimo 90 mg/dl

250

300 mg/dl

Pgina 316

C aptulo 4

SENSIBILIDAD DIAGNSTICA
(fraccin de verdaderos positivos)

1,00

Curva ROC
de la uremia

0,75

0,50
Las curvas ROC
son
ndices
deson
la ndices
Las curvas
ROC
exactitud
diagnstica
de la exactitud
diagnosticayy
proporcionan
el mejor
proporcionan el mejor
criterio
criterio
en el
unificadorunificador
en el proceso
de
evaluacin de
de una
prueba. de
proceso
evaluacin
una prueba.

0,25

0,00
0,00

0,25

0,50

0,75

1 ESPECIFICIDAD
(fraccin de Falsos positivos)

1,00

Pgina 317

C aptulo 4

Pgina 318

Pregunta de investigacin
Qu tcnica analtica presenta una mayor exactitud, valor global,
rentabilidad, o efectividad clnica la urea o la creatinina srica en
el diagnstico de la insuficiencia renal?
Objetivo: Evaluacin de la urea frente a la creatinina en el diagnstico de
la insuficiencia renal.

Urea (srica)

Creatinina (srica)

Cul es el test estadstico ms acertado?


Comparacin del rea bajo la curva ROC

C aptulo 4

1,00

SENSIBILIDAD DIAGNSTICA
(fraccin de Verdaderos Positivos)

Curva ROC
de la creatinemia
0,75

Curva ROC
de la uremia

0,50
Cuanto ms prxima se sita una curva
ROC a la esquina superior izquierda,
ms alta es la exactitud diagnstica de la
prueba. Si comparamos en el mismo
grfico las curvas obtenidas con la urea y
la creatinina, sta ltima por estar
situada ms hacia arriba y hacia la
izquierda tendr la mayor exactitud.

0,25

0,00
0,00

0,25

0,50

0,75

1 ESPECIFICIDAD
(fraccin de Falsos Positivos)

1,00

Pgina 319

C aptulo 4

Pgina 320

Pregunta de investigacin
Qu prueba diagnstica (uremia versus creatinemia) presenta
una mayor rentabilidad, exactitud o valor global en el diagnstico
de la insuficiencia renal?
Variables
contrastadas

rea bajo la curva Error estndar del Lmite inferior


ROC
rea
del intervalo de
confianza al 95%

Lmite superior
del intervalo de
confianza al 95%

Uremia

0,930

0,012

0,906

0,955

Creatinemia

0,984

0,005

0,974

0,994

Cul es el test estadstico ms acertado?

C aptulo 4

Comparacin del rea de las curvas ROC en muestras


dependientes
Z=

( A 1 A 2)
( EEA 1 )2 + (EEA 2 )2

2 r * EEA 1 * EEA 2

A1 = rea bajo la curva ROC de la tcnica 1


A 2 = rea bajo la curva ROC de la tcnica 2
EEA 1 = error estndar del rea bajo la curva ROC de la tcnica 1
EEA 2 = error estndar del rea bajo la curva ROC de la tcnica 2
r = coeficiente de correlacin entre las reas de ambas tcnicas para
muestras dependientes

Pgina 321

C aptulo 4

Z=

Pgina 322

( A 1 A 2)
( EEA 1 )2 + (EEA 2 )2

2 r * EEA 1 * EEA 2

A 1 (creatinina) = 0,984

EEA1 (creatinina) = 0,005.

A 2 (urea) = 0,930

EEA2 (urea) = 0,012.

Hiptesis nula Ho: A1 A 2 = 0 .


Hiptesis alternativa Ha: A1 A 2 0 .
Resultado: El estadstico para la comparacin de ambas curvas Z de Hanley y
McNeil vale 4,15 que como es mayor que Z95% = 1,96 .
Conclusin: Ambas pruebas tienen un rendimiento significativamente distinto.

C aptulo 4

Pregunta de investigacin
Qu utilidad clnica tienen los niveles de VCM en el diagnstico de la anemia ferropnica?
Objetivo: Evaluacin del VCM en el diagnstico de la anemia ferropnica.
Tcnica analtica a valuar
VCM
(hemograma)

Tcnica de referencia
(patrn de oro)
Depsitos de Fe en mdula sea

Cul es el test estadstico ms acertado?

Pgina 323

C aptulo 4

Pgina 324

Tipos de error en las pruebas diagnsticas


Tipos de error en las pruebas diagnsticas

Test de laboratorio
VCM
(hemograma)

Examen de los depsitos de hierro en mdula sea


Dficit de Fe

Presencia de Fe

Positivo
(+)
VCM
BAJO
(microcitosis)

VERDADEROS
POSITIVOS
VP

FALSO POSITIVO
FP

Negativo
(-)
VCM
NORMAL

FALSO NEGATIVO
FN

VERDADEROS
NEGATIVOS
VN

C aptulo 4

VCM en 100 pacientes con diagnstico de


anemia ferropnica
Tcnica de referencia: Examen de los
depsitos de hierro en mdula sea

Volumen corpuscular medio (VCM)

Ausencia de Hierro (n= 33)

52, 58, 62, 65, 67, 68, 70, 72, 72, 73, 73, 74,75,
77, 77, 77, 78, 78, 80, 80, 81, 81, 81, 81, 84, 84,
85, 85, 87, 88, 88, 92, 92

Presencia de hierro (n=67)

60, 66, 68, 69, 71, 71, 71, 73, 74, 74, 74, 76,76,
77, 77, 77, 78, 79, 79, 79, 80, 80, 81, 81,82, 82,
82, 83, 83, 83, 83, 83, 83, 83, 83, 84,84, 84, 85,
85, 86, 86, 86, 86, 88, 88, 88, 89,89, 89, 90, 90,
90, 91, 91, 93, 93, 93, 94, 94,94, 94, 96, 97, 98,
100, 103

Beck JR, Shultz EK. The use of relative operating characteristic (ROC) curves in test performance
evaluation. Arch Pathol Lab Med 1986; 110:13-20.

Pgina 325

C aptulo 4

110
100
Tcnica analtica a evaluar

VCM
(hemograma)

90

FN

VN

FP

VP

80
70
60
50

VCM < 80
Sensibilidad = 55,9%
Especificidad = 71,2%

Hierro normal

Hierro BAJO

Examen de los depsitos de hierro en mdula sea


Tcnica de referencia (patrn de oro)

Pgina 326

C aptulo 4

110
100
Tcnica analtica a evaluar

VCM
(hemograma)

90
80

FN

VN

70
60

FP

VP

50

VCM < 65
Sensibilidad = 8,8%
Especificidad = 98,5%

Hierro normal

Hierro BAJO

Examen de los depsitos de hierro en mdula sea


Tcnica de referencia (patrn de oro)

Pgina 327

C aptulo 4

110
100
Tcnica analtica a evaluar

VCM
(hemograma)

90
80
70

FN

VN

FP

VP

60
50

VCM < 90
Sensibilidad = 94,1%
Especificidad = 25,8%

Hierro normal

Hierro BAJO

Examen de los depsitos de hierro en mdula sea


Tcnica de referencia (patrn de oro)

Pgina 328

C aptulo 4

La pruebas diagnsticas
tienen
un solonopar
Lano
pruebas
diagnosticas
tienen
unsensibilidad/especificidad
solo par sensibilidad/especificidad
(S/E),
sino sino
muchos,
uno por cada
(S/E),
muchos,
uno
nivel
decisin
o punto
corte
pordecada
nivel
dededecisin
que
adopte.
o se
punto
de corte que se
adopte.

SENSIBILIDAD DIAGNSTICA
(fraccin de Verdaderos Positivos)

100
80

VCM < 81

60
40
Cul ser el par que describa
la exactitud de la prueba?

20
0
0

20

40

Pgina 329

60

80

1 ESPECIFICIDAD
(fraccin de Falsos Positivos)

100

Punto de corte ideal para el


VCM es de < 81, valor lmite que
permite resumir los resultados de
una escala continua en dos
categoras: positivo y negativo
con una mayor exactitud o
rentabilidad diagnstica.

VCM < 81
Sensibilidad = 61%
Fraccin de FP = 30%
Especificidad = 70%

El clculo del rea bajo la curva es de 0,717 con un EE de 0,05, es decir, el VCM es una prueba diagnstica
de baja rentabilidad, y por tanto no se aconseja, como prueba nica, en el diagnstico de la anemia
ferropnica.

C aptulo 4

Pgina 330

C aptulo 4

Pgina 331

C aptulo 4

Pgina 332

C aptulo 4

Pgina 333

C aptulo 4

Pregunta de investigacin
Qu tcnica analtica presenta una mayor rentabilidad, el VCM
o la ferritina en el diagnstico de la anemia ferropnica?
Objetivo: Evaluacin del VCM frente a la ferritina en el diagnstico de la
anemia ferropnica.

VCM
(hemograma)

Ferritina (srica)

Cul es el test estadstico ms acertado?


Comparacin del rea bajo la curva ROC

Pgina 334

C aptulo 4

Punto Corte VCM

Sensibilidad
(%)

Especificidad
(%)

100 especificidad
(%)

65

8,8

98,5

1,5

70

20,6

93,9

6,1

75

38,2

84,8

15,2

80

55,9

71,2

28,8

85

79,4

43,9

56,1

90

94,1

25,8

74,2

92

97,1

19,7

80,3

Construccin de la curva ROC: Es un grfico que muestra todos los pares sensibilidad/especificidad
resultantes de la variacin continua de los puntos de corte en todo el rango de resultados observados.

Pgina 335

C aptulo 4

Pgina 336

Comparacin del rea bajo la curva: ferritina srica versus


VCM
100
SENSIBILIDAD DIAGNSTICA

Ferritina
VCM
Para comparar el VCM con los niveles
sricos de ferritina, se construye para
ella otra curva y se calculara su rea.
Se comparan las reas mediante el
estadstico Z de Hanley y McNeil (1983).
0
0

1 ESPECIFICIDAD
(Falsos positivos)

100

Hanley JA, McNeil BJ. A method of comparing the areas under receiver operating characteristic curves
derived from the same cases. Radiology 1983; 148: 839-843.

C aptulo 4

Comparacin del rea de las curvas ROC en muestras


dependientes
Z=

( A 1 A 2)
( EEA 1 )2 + (EEA 2 )2

2 r * EEA 1 * EEA 2

A1 = rea bajo la curva ROC de la tcnica 1


A 2 = rea bajo la curva ROC de la tcnica 2
EEA 1 = error estndar del rea bajo la curva ROC de la tcnica 1
EEA 2 = error estndar del rea bajo la curva ROC de la tcnica 2
r = coeficiente de correlacin entre las reas de ambas tcnicas para
muestras dependientes
Hanley JA, McNeil BJ. A method of comparing the areas under receiver operating characteristic curves
derived from the same cases. Radiology 1983; 148: 839-843.

Pgina 337

C aptulo 4

Z=

Pgina 338

( A 1 A 2)
( EEA 1 )2 + (EEA 2 )2

2 r * EEA 1 * EEA 2

A 1 (creatinina) = 0,984

EEA1 (creatinina) = 0,005.

A 2 (urea) = 0,930

EEA2 (urea) = 0,012.

Hiptesis nula Ho: A1 A 2 = 0 .


Hiptesis alternativa Ha: A1 A 2 0 .
Resultado: El estadstico para la comparacin de ambas curvas Z de Hanley y
McNeil vale 4,15 que como es mayor que Z95% = 1,96 .
Conclusin: Ambas pruebas tienen un rendimiento significativamente distinto.

C aptulo 4

Comparacin del rea bajo la curva: ferritina srica


versus VCM

Pgina 339

C aptulo 4

Eleccin del punto de corte:


Criterio basado en el equilibrio de riesgos y beneficios de
las decisiones mdicas
Es un enfoque prctico que se basa en el cociente entre los costes de un
resultado falso positivo (FP) frente a un falso negativo (FN), en funcin de
la prevalencia (P) de la enfermedad. El valor de corte ptimo se determina
hallando el punto de la curva ROC cuya tangente a la curva tiene de
pendiente el valor de m.

m =

Coste de FP
Coste de FN

1-P
P

Zweig MH, Campbell G. Receiver-operating characteristic (ROC) plots: a fundamental evaluation tool in
clinical medicine. Clin Chem 1993; 39: 561-577.
McNeil BJ, Keeler E, Adelstein SJ. Primer on certain elements of medical decision making. N Engl J Med
1975; 293: 211-215.

Pgina 340

C aptulo 4

Pgina 341

Eleccin del punto de corte:


Postulados de Galen y Gambino
1. Criterio de mxima SENSIBILIDAD DIAGNSTICA

Se elige la mayor sensibilidad posible cuando:


1. La enfermedad sea grave y no pueda pasar inadvertida.
2. La enfermedad sea tratable, y
3. Los resultados falsos positivos no supongan un traumatismo
psicolgico o econmico en los individuos examinados.
Podras poner algn ejemplo?

Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of medical diagnoses. Nueva
York: J Wiley and Sons, lnc., 1975.

C aptulo 4

Pgina 342

Cribado poblacional de cncer de mama (CaM)


Programa preventivo destinado a la deteccin precoz de CaM mediante la
realizacin de mamografa bilateral con periodicidad bienal en mujeres de 45
a 70 aos. La realizacin del screening permite la deteccin precoz de CaM
en un estadio menos avanzado que el que correspondera a un diagnstico
clnico, lo que supone una considerable mejora en cuanto a la afectacin,
pronstico de la enfermedad y reduccin de aos de vida perdidos.
Variable PREDICTORA
Cualitativa dicotmica
Mamografa bilateral

Variable RESULTADO
Cualitativa dicotmica
Cncer de mama

C aptulo 4

Pgina 343

Cumple los postulados de Galen y Gambino?


En Espaa se ha descrito que la tasa acumulada de falsos positivos en un
programa de cribado de mama es del 30% tras 10 determinaciones bianuales
(1). De hecho, diversos estudios han demostrado que, por cada muerte
prevenida a travs de un programa de cribado, han aparecido al menos 200
resultados falsos positivos (2). En respuesta a este hecho, la OMS ha incidido
en nuevos criterios para los programas de cribado, centrndose en aspectos
ticos, en las consecuencias psicolgicas de resultados falsos positivos y en
la necesidad del consentimiento informado (3).

1. Castells X, Molins E, Macia F. Cumulative false positive recall rate and association with participant
related factors in a population based breast cancer screening programme. J Epidemiol Community Health.
2006;60:316-21.
2. Raffle AE, Alden B, Quinn M, Babb PJ, Brett MT. Outcomes of screening to prevent cancer: analysis
of cumulative incidence of cervical abnormality and modelling of cases and deaths prevented. BMJ.
2003;326:901.
3. Brodersen J, McKenna SP, Doward LC, Thorsen H. Measuring the psychosocial consequences of
screening. Health Qual Life Outcomes. 2007;5:3.

C aptulo 4

Cribado poblacional del cncer de pulmn (CP)


mediante TC
Variable PREDICTORA
Cualitativa dicotmica
Tomografa computarizada (TC)

Variable RESULTADO
Cualitativa dicotmica
Cncer de pulmn

Cumple los postulados de Galen y Gambino?

Pgina 344

C aptulo 4

Pgina 345

Un estudio publicado por Bach et al (2007) acerca del cribado de cncer de


pulmn sealaba que el uso de la tomografa computarizada (TC) puede
aumentar la tasa de diagnstico y tratamiento de dicho cncer sin reducir el
riesgo de avance de la enfermedad o la mortalidad. Por lo tanto, concluan la
inutilidad del cribado en la prevencin del cncer de pulmn.

Bach PB, Jett JR, Pastorino U, Tockman MS, Swensen SJ, Begg CB. Computed tomography screening and
lung cancer outcgomes. JAMA. 2007;297:953-61.

C aptulo 4

Pgina 346

Cribado poblacional de cncer de colon


Programa preventivo destinado a la deteccin precoz de colon
Variable PREDICTORA
Cualitativa dicotmica

Variable RESULTADO
Cualitativa dicotmica

Deteccin de SANGRE OCULTA en


heces (guayacol)

Cncer de colon

Sensibilidad = 40-80%
Especificidad = 90-99%

La sensibilidad de la prueba es tan slo de 5060% cuando se lo utiliza una


vez, pero puede ascender a 90% cuando se la utiliza cada 12 aos en un
perodo de tiempo prolongado (sensibilidad programtica).

C aptulo 4

Pgina 347

Cribado poblacional de cncer de colon


Programa preventivo destinado a la deteccin precoz de colon
El cncer de colon es el tipo de cncer con mayor posibilidad de deteccin
precoz y que responde mejor al tratamiento en estadios iniciales, por ello se
propone una prueba gentica a la poblacin diana: hombres y mujeres a partir
de los 50 aos..

Variable PREDICTORA
Cualitativa dicotmica

Variable RESULTADO
Cualitativa dicotmica

Deteccin de la forma metilada del


gen Septina 9 (SEPT9).

Cncer de colon

Sensibilidad = 67%
Especificidad = 88%

C aptulo 4

Pgina 348

Cumple los postulados de Galen y Gambino?


Los resultados FALSOS POSITIVOS causan ansiedad y pueden conducir
a un aumento de pruebas invasivas para determinar si hay enfermedad
realmente, en este caso una prueba positiva a la deteccin de sangre oculta
en heces ser seguida por una colonoscopia.

C aptulo 4

Pgina 349

Falsos positivos versus Falsos negativos


1. Gravedad o importancia en salud pblica. Si la enfermedad puede ser tratada y
detectada evitando complicaciones posteriores han de utilizarse pruebas con alta
SENSIBILIDAD, es decir con baja tasa de FALSOS NEGATIVOS.
2. Si el coste del proceso asistencial (posibles pruebas invasivas complementarias,
exmenes y cuidados mdicos y de enfermera requeridos ) del enfermo es alto se deben
elegir pruebas con alta ESPECIFICIDAD, para reducir los falsos positivos.
3. Si la enfermedad diagnosticada conlleva consecuencias psicosociales graves, como
la infeccin por VIH, han de minimizarse los falsos positivos, eligiendo pruebas de alta
ESPECIFICIDAD.
4. Baja prevalencia de la enfermedad. En los programas de screening se eligen pruebas
de alta ESPECIFICIDAD, para reducir la tasa de falsos positivos y as garantizar la
eficiencia del programa.

C aptulo 4

Pgina 350

Las carencias metodolgicas en la investigacin evaluativa de pruebas diagnsticas


explican en parte la inadecuacin del uso de pruebas diagnsticas. Por otra parte, no se
ha considerado la potencial iatrogenia atribuible al uso de pruebas diagnsticas, y se hace
necesaria una monitorizacin de los posibles efectos adversos derivados de cualquier
tecnologa diagnstica, as como la informacin detallada a los pacientes de sus beneficios
y riesgos, tanto en el campo del cribado como en el del diagnstico clnico.

C aptulo 4

Pgina 351

Eleccin del punto de corte:


Postulados de Galen y Gambino
2. Criterio de mxima ESPECIFICIDAD DIAGNSTICA

Se elige la mayor especificidad posible cuando:


1. La enfermedad sea importante pero difcil de curar o incurable, y
2. El hecho de conocer que no se padezca la enfermedad tiene una
importante carga sanitaria y psicolgica.
Podras poner algn ejemplo?

Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of medical diagnoses. Nueva
York: J Wiley and Sons, lnc., 1975.

C aptulo 4

Pgina 352

Eleccin del punto de corte:


Postulados de Galen y Gambino
3.- Criterio de alto VALOR PREDICTIVO POSITIVO

Se elige un alto VPP cuando:


El tratamiento de los falsos positivos (FP) pueda tener consecuencias
graves en personas que NO tienen la enfermedad.

VPP =

VP
VP + FP

Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of medical diagnoses. Nueva
York: J Wiley and Sons, lnc., 1975.

C aptulo 4

Pgina 353

Eleccin del punto de corte:


Postulados de Galen y Gambino
4. Criterio de mxima EXACTITUD DIAGNSTICA

Se desea una elevada exactitud (efectividad, valor global o rentabilidad


diagnstica) cuando:
1. La enfermedad sea importante pero curable, y
2. Tanto los falsos positivos (FP) como los falsos negativos (FN)
supongan un traumatismo y conlleven consecuencias graves.

Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of medical diagnoses. Nueva
York: J Wiley and Sons, lnc., 1975.

C aptulo 4

Ventajas de las curvas ROC en la evaluacin de pruebas


diagnsticas
1. Son una representacin grfica fcilmente comprensible de la capacidad de
discriminacin de la prueba diagnstica en todo el rango de puntos de corte.
2. Son simples, grficas y fciles de interpretar visualmente.
3. No requieren un nivel de decisin particular porque est incluido todo el espectro de
puntos de corte.
4. Son independientes de la prevalencia, ya que ni la sensibilidad ni la especificidad
dependen de ella.
5. Proporcionan una comparacin visual directa entre distintas pruebas en una escala
comn, mientras que otro tipo de grficos, como los diagramas de puntos o los
histogramas de frecuencias requieren diferentes grficos cuando difieren las escalas.
6. La especificidad y la sensibilidad son fcilmente accesibles en el grfico, en contraste
con los diagramas de puntos y los histogramas.
Zweig MH, Campbell G. Receiver-Operating Characteristic (ROC) Plots: fundamental evaluation tool in
clinical medicine. Clin Chem 1993; 39: 561-577.
Burgueo MJ, J.L. Garca-Bastos JL, Gonzlez-Buitrago JM. Las curvas ROC en la evaluacin
de las pruebas diagnsticas. Med Clin (Barc) 1995: 104: 661-670.

Pgina 354

C aptulo 5

Captulo 5
Publicacin Bioestadstica: Anlisis bivariante.
Test de contraste de hiptesis.
Cualitativa versus cualitativa.

Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Pgina 355

C aptulo 5

Pgina 356

Materiales y mtodos
Estructura
1. Tipo de diseo (estudio)
2. Sujetos incluidos (criterios de seleccin de la muestra)
3. Fuentes de informacin
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales)
5. Instrumentos y procedimientos de medida (cuestionarios)
6. Definicin de las variables y covariables incluidas en el estudio (factor de
estudio y criterio de evaluacin)
7. Limitaciones y consideraciones ticas de la investigacin
8. Pruebas estadsticas a utilizar (programa estadstico)

C aptulo 5

Fases del anlisis estadstico


1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE

Pgina 357

C aptulo 5

Decisiones que se pueden tomar en un test de contraste


de hiptesis despus de conocer el valor de significacin
estadstica p
p < 0,05

AB

p 0,10

A=B

Se rechaza la hiptesis nula

No se puede rechazar la hiptesis nula

No parece que el azar pueda


explicarlo todo

No se puede descartar que el azar lo


explique todo

El EFECTO observado es mayor que


el ERROR

El EFECTO observado es similar que el


ERROR

Hay diferencias estadsticamente


significativas

NO hay diferencias estadsticamente


significativas

Existen evidencias a favor de la


hiptesis alternativa Ha, y por tanto
rechazamos la hiptesis nula Ho

NO existen evidencias a favor de la


hiptesis alternativa Ha, y por tanto
aceptamos la hiptesis nula Ho

Los lmites de 0,05 y 0,1 pueden ser considerados en cierto modo


arbitrarios y aproximados

Pgina 358

C aptulo 5

Anlisis estadstico
Tipos de test analticos estadsticos de contraste de hiptesis
segn el tipo de variables implicadas en el estudio
Variable dependiente
Variable resultado
Variable
Predictora
Variable
Independiente

Dicotmica

Continua

Dicotmica

Test de 2

t de Student

Continua

Regresin logstica

Regresin lineal

Pgina 359

C aptulo 5

Anlisis estadstico

ANLISIS ESTADSTICO
Variable
Predictora
Variable
Independiente

Variable resultado
Dicotmica

Continua

Dicotmica

Test de 2

t de Student

Continua

Regresin logstica

Regresin lineal

Test de 2

Pgina 360

C aptulo 5

Pgina 361

Tipos de test analticos estadsticos bivariantes de contraste


de hiptesis ms frecuentes
Variable
PREDICTORA o
Independiente (factor
de estudio)

Variable RESULTADO o Dependiente (Criterio de evaluacin)


Cualitativa nominal
dos
categoras

Cualitativa nominal
>2
categoras

Cualitativa ordinal o
Cuantitativa NO
paramtrica

Cuantitativa
paramtrica

Cualitativa dos grupos


independientes

Chi cuadrado
Z comparacin de
proporciones
Test exacto de
Fisher

Chi cuadrado

U de Mann-Whitney

T de Student
(prueba de Welch)

Cualitativa dos grupos


apareados

Test de McNemar

Q de Cochran

Prueba de los
rangos
de Wilcoxon

T de Student
para datos
emparejados

Cualitativa > 2 grupos


independientes

Chi cuadrado

Chi cuadrado

Prueba de KruskalWallis

Anlisis de la Varianza
(ANOVA)

Cualitativa > 2 grupos


apareados

Q de Cochran

Q de Cochran

Prueba de Friedman

Anlisis de la Varianza
de dos vas

Cuantitativa

Regresin logstica

Regresin logstica

Correlacin de
Sperman
Tau de Kendall

Regresin lineal
Correlacin de Pearson

C aptulo 5

Pgina 362

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable
Independiente o
PREDICTORA

Variable
Dependiente o
RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de Fisher
Test de McNemar
Q de Cochran
REGRESIN LOGSTICA

Si el tamao muestral es grande


Si el tamao muestral es pequeo
Dos grupos de muestras repetidas o apareadas
Ms de dos grupos de muestras repetidas o apareadas
Varias variables predictoras cualitativas

Cualitativa

Cuantitativa

t de Student
Anlisis de la Varianza
Test de Mann-Whitney
Test de Wilcoxon
Test de Kruskall-Wallis
Test de Friedman

Compara medias entre dos grupos independientes


Compara medias entre ms de dos grupos independientes
Dos grupos independientes No paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, medidas repetidas
Ms de dos grupos No paramtrico medidas repetidas

Cuantitativa

Cualitativa

Regresin logstica simple


Regresin logstica multivariante

Una sola variable predictora cuantitativa


Varias variable predictoras cuantitativa o cualitativas

Cuantitativa

Cuantitativa

Regresin lineal simple


Correlacin de Pearson
Correlacin de Sperman
REGRESIN MLTIPLE

Paramtrico
Paramtrico
No paramtrico
Varias variables predictoras cuantitativas

Cualitativa

Superviviencia

Kaplan-Meier
Long-Rank
Regresin de COX

Curvas de superviviencia
Compara curvas de superviviencia
Anlisis Multivariante

C aptulo 5

Datos categricos:
Cualitativa versus cualitativa. Nominales
- Test de 2 de Pearson
- Relacin entre dos variables cualitativas nominales o policotmicas
- Comparacin de proporciones
- Correccin de Yates
- Test exacto de Fisher
- Valores esperados menores de 5
- Razn de verosimilitud
- Evaluacin de pruebas diagnsticas
- Test de 2 de McNemar
- Datos apareados o emparejados
- Coeficiente PHI ()
- V de Cramer
- Coeficiente de contingencia
- Coeficiente de incertidumbre
- Tau de Goodman y Kruskal
- Lambda de Goodman y Kruskal (coeficiente de predictibilidad de Guttman)

Pgina 363

C aptulo 5

Datos categricos:
Cualitativa versus cualitativa. Ordinales
- Test de 2 de tendencia lineal
- Tau-B de Kendall o Stuart
- Tau-C de Kendall
- Coeficiente Gamma de Goodman y Kruskal
- D de Somers
- Correlacin de Spearman
Estos estadsticos NO se pueden
utilizar cuando alguna de las variables
sea NOMINAL

Pgina 364

C aptulo 5

Test de 2 de Pearson
Variable RESULTADO
Variable PREDICTORA

(+)

(-)

Total

Si

a+b

No

c+d

Total

a+c

b+d

n ( a d b c )2
(a + b) (c + d) (a + c) (b + d)
Grados de libertad = [ K - 1] [F - 1]

2 =

(f f )
fo
o- e

Pgina 365

C aptulo 5

Test de 2 de Pearson
Grados de libertad = [K - 1] [F - 1]
Tabla de valores crticos (tabulados) de 2
Grados de libertad

Tabla 2 x F

Valores crticos con un nivel de


confianza del 95%

3,84

5,99

7,81

9,49

11,07

12,59

100

99

124,34

K = n de columnas
F = n de filas

Pgina 366

C aptulo 5

Pgina 367

Frecuencia relativa esperada

Influencia de los Grados de libertad k en la distribucin de


probabilidades de 2 de Pearson
Grados de libertad (gl) = (K - 1) (F 1)

2 de Pearson para gl=1

2 de Pearson para gl=3

2 de Pearson para gl=2

2 de Pearson para gl=6

C aptulo 5

Frecuencia relativa esperada

2
(
o - fe )
f
2 =
fo

fo =
fe =

frecuencia observada
frecuencia esperada

Error alfa
Ho

Ha
2Pearson tabulado= 3,84

Pgina 368

C aptulo 5

Pgina 369

Influencia de los Grados de libertad k en la distribucin de


probabilidades de 2 de Pearson
Grados de libertad (gl) = (K - 1) (F 1)
gl = 3

gl = 5

gl = 10

Grados de libertad

7,81

2 3 4

6 7

K = n de columnas
F = n de filas

11,07

8 9 10 11 12 13 14 15

C aptulo 5

Pgina 370

Test de 2 de Pearson
Condiciones necesarias y suficientes de aplicacin
1. Ambas variables deben ser cualitativas en escala NOMINAL.
2. Nmero de sujetos estudiados igual o superior a 40 (n>40)
3. Ninguno de los valores esperados en cada casilla debe ser menor de 5
4. No se debe aplicar cuando la variable dependiente o resultado es
ORDINAL
5. Es un test no dirigido (test de planteamiento bilateral), que nos indica si
existe o no relacin entre dos variables cualitativas pero no en qu sentido
se produce tal, ni cuantifica la intensidad de dicha asociacin.

La prueba permite comprobar si dos variables cualitativas estn o no asociadas. Si al final del
estudio concluimos que las variables no estn relacionadas podremos decir que ambas variables son
independientes, con un determinado nivel de confianza, generalmente del 95%.

C aptulo 5

Pgina 371

Pregunta de investigacin
Qu tcnica quirrgica es preferible en pacientes que deben ser
intervenidos de colecistectoma va laparoscpica?
Variable PREDICTORA
Cualitativa dicotmica
- KTP/532 lser
- Electrociruga monopolar

Variable RESULTADO
Cualitativa dicotmica
Desarrollo de complicaciones graves
postquirrgicas

Cul es el test estadstico ms adecuado?


Lane GE, Lathrop JC. Comparison of results of KTP/532 laser versus monopolar electrosurgical dissection
in laparoscopic cholecystectomy.
J Laparoendosc Surg 1993; 3: 209-214.

C aptulo 5

Pgina 372

Existe diferencia significativa respecto del porcentaje de


complicaciones graves entre ambas tcnicas de diseccin?
Ho (hiptesis nula) = No hay diferencia entre ambas tcnicas de diseccin.
Ha (hiptesis alternativa) = S existe diferencia entre ambas tcnicas de
diseccin.

KTP/532 lser

Electrociruga monopolar

Lane GE, Lathrop JC. Comparison of results of KTP/532 laser versus monopolar electrosurgical dissection
in laparoscopic cholecystectomy.
J Laparoendosc Surg 1993; 3: 209-214.

C aptulo 5

Test de 2 de Pearson
Variable resultado
Complicaciones postquirrgicas graves
Variable predictora
Tipo de ciruga

SI (+)

NO (-)

Total

KTP/532 lser

16 (8%) P1

183

199

Electrociruga
monopolar

11 (2,6%) P2

411

422

2Pearson = 9,60

p = 0,0019

Existe asociacin

Pgina 373

C aptulo 5

Si [P1 - P2] es mayor que el producto de 1,96 (Z95% error = 0,05) multiplicado por el error estndar, concluimos que
la diferencia es significativa. Por lo tanto, hemos de calcular el error estndar para luego compararlo con la diferencia
observada en los grupos en estudio.

[ P1 - P2 ]

[P1 - P2] = [0,080 - 0,026] = 0,054

Z95% X EE

P= [P1 - P2] / 2 = [0,080 + 0,026] / 2 = 0,053


El error estndar se calcula de la siguiente forma:

EE = p (1 p ) ( 1 / n1 + 1 / n2 )

Error estndar (EE) = p (1 p ) ( 1 / n1 + 1 / n2 )

Error estndar (EE) = 0,053 (1-0,053) (1/199+ 1/422)= 0,00035


Error estndar (EE) multiplicado por Z95% = 0,00035 * 1,96 = 0,00069

Z95%= 1,96

Si la diferencia de [P1 - P2] ( 0,054) > EE * Z95% (0,00069) concluimos que existe una diferencia estadsticamente
significativa entre los grupos en estudio (p< 0,05); razn por la cual rechazamos Ho, por ende, aceptamos la Ha.

[ P1 - P2 ] < Z95%

EE

p > 0,1

Ho (hiptesis nula)

[ P1 - P2 ] > Z95%

EE

p < 0,05

Ha (hiptesis alternativa)

Pgina 374

C aptulo 5

Pgina 375

Figura 1. Frecuencia de complicaciones graves en 641 pacientes colecistectomizados por va


laparoscpica. Distribucin por tcnicas de diseccin.
p = 0,0019

KTP/532 lser

Electrociruga
monopolar

Test de 2 de Pearson
Lane GE, Lathrop JC. Comparison of results of KTP/532 laser versus monopolar electrosurgical dissection
in laparoscopic cholecystectomy. J Laparoendosc Surg 1993; 3: 209-214.

C aptulo 5

Test de 2 de Pearson
Resultados de un estudio
imaginario que estudia la
eficacia de dos tratamientos
A y B en dos grupos de 30
pacientes

Variable resultado
Porcentaje de respuestas a cada tratamiento

Variable predictora
Tipo de tratamiento

SI (+)

NO (-)

Total

16 (8%) P1

183

199

11 (2,6%) P2

411

422

2Pearson = 2,5

p = 0,12

No existe asociacin

Pgina 376

C aptulo 5

Comparacin de proporciones:
Importancia del intervalo de confianza
Resultados de un estudio imaginario que estudia la eficacia de dos
tratamientos A y B en dos grupos de 30 pacientes

Diferencia [ P1 - P2 ] = 0,70 - 0,50 = 0,20

IC95% = 0,20 024


- 4% a + 44%
A 50%

20%

B 70%

Pgina 377

C aptulo 5

Pgina 378

Realidad 15: ...de lo


estadsticamente significativo a lo
clnicamente relevante.

Es clnicamente relevante?

Es estadsticamente significativo?

S (xito)

No (fracaso)

S (p < 0,05)

Estadsticamente significativo

Estadsticamente significativo

Clnicamente relevante

Clnicamente irrelevante (p < 0,05)

Estadsticamente NO
significativo

Estadsticamente NO significativo

No (p > 0,1)

Clnicamente
relevante

Clnicamente irrelevante

C aptulo 5

Test de 2 de Pearson
Resultados de un estudio
imaginario que estudia la
eficacia de dos tratamientos
A y B en dos grupos de 800
pacientes

Variable resultado
Porcentaje de respuestas a cada tratamiento

Variable predictora
Tipo de tratamiento

SI (+)

NO (-)

Total

480 (60%) P1

320

800

520 (65%)

280

800

2Pearson = 4,2

p = 0,04

P2

Existe asociacin

Pgina 379

C aptulo 5

Comparacin de proporciones:
Importancia del intervalo de confianza
Resultados de un estudio imaginario que estudia la eficacia de dos
tratamientos A y B en dos grupos de 800 pacientes

Diferencia [ P1 - P2 ] = 0,65 - 0,60 = 0,05

IC95% = 0,05 0,047


+ 0,3% a + 9,7%
A 60%

5%

B 65%

Pgina 380

C aptulo 5

Pgina 381

Realidad 15: ...de lo


estadsticamente significativo a lo
clnicamente relevante.

Es clnicamente relevante?

Es estadsticamente significativo?

S (xito)

No (fracaso)

S (p < 0,05)

Estadsticamente significativo

Estadsticamente significativo

Clnicamente relevante

Clnicamente irrelevante (p < 0,05)

Estadsticamente NO
significativo

Estadsticamente NO significativo

No (p > 0,1)

Clnicamente
relevante

Clnicamente irrelevante

C aptulo 5

Pgina 382

Importancia del intervalo de confianza


Cul de los siguientes tratamientos es estadsticamente
significativo?
Ho

A= B

Ha

Diferencia con INTERS CLNICO

B - A = 0 A B

AB

BA=
10%

Ho

RC
A
B
C
D
E

-10

-5

0% 5 10 15 20% 25 30

35 40

B A = 20%

Tratamiento

Diferencia
observada

Significacin
estadstica

IC95%

20%

p < 0,05

+10 a
+30%

30%

p < 0,05

+25 a
+35%

10%

p < 0,05

+5 a +15%

10%

NS

-5 a +25%

25%

p < 0,05

+15 a
+35%

Resultados hipotticos de un estudio que compara un tratamiento activo frente a un placebo y utiliza como
medidas del efecto la diferencia entre los porcentajes de curacin observados. Se considera que la mnima
diferencia con relevancia clnica es del 20%. RC: Diferencia con relevancia clnica.

C aptulo 5

Pgina 383

Importancia del intervalo de confianza


Tratamiento

Diferencia
observada

Significacin
estadstica

IC95%

Interpretacin

20%

p < 0,05

+10 a +30%

No concluyente
Potencialmente
importante
(observado =
relevante)

30%

p < 0,05

+25 a +35%

Importante

10%

p < 0,05

+5 a +15%

No concluyente

10%

NS

-5 a +25%

No concluyente

25%

p < 0,05

+15 a +35%

No concluyente
Potencialmente
importante
(observado >
relevante)

Resultados hipotticos de un estudio que compara un tratamiento activo frente a un placebo y utiliza como
medidas del efecto la diferencia entre los porcentajes de curacin observados. Se considera que la mnima
diferencia con relevancia clnica es del 20%. RC: Diferencia con relevancia clnica.

C aptulo 5

Pgina 384

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso de la ciudad de
Ceuta y la prevalencia de inmunizacin frente al virus de la Rubeola
en la poblacin gestante?
Variable PREDICTORA
Cualitativa dicotmica
- Cristianas
- Musulmanas

Variable RESULTADO
Cualitativa dicotmica
Virus de la Rubeola

Cul es el test estadstico ms adecuado?


Daz Portillo J, Torres E, Vadillo Andrade J, Laroca C.PREVALENCIA DE ANTICUERPOS FRENTE AL
VIRUS DE LA RUBOLA EN UNA POBLACIN GESTANTE DE CEUTA. Revista de Diagnstico Biolgico
1995, 44: 114-119.

C aptulo 5

Test de 2 de Pearson
Rubeola

Variable predictora
Religin

Variable resultado
Inmunizacin

Cristiana

Musulmana

(+)

279 (87,2%)

372 (86,1%)

(-)

41

60

2Pearson = 0,18; p=0,668

No existe asociacin

Pgina 385

C aptulo 5

Pgina 386

Resumen del procesamiento informtico de los datos


Clculos del programa estadstico
tabla 2 x 2

Valor

2 Pearson

Grados de
libertad

Contraste
bilateral

0,183

0,669

Correccin de Yates

0,102

0,749

Razn de verosimilitud

0,184

Test exacto de Fisher


N Casos vlidos

Contraste
unilateral

0,668
1

0,746

0,376

752

Ho (hiptesis nula) = La inmunizacin frente al virus de la rubeola NO est asociada al grupo cultural de la
gestante.
Ha (hiptesis alternativa) = La inmunizacin frente al virus de la rubeola est asociada al grupo cultural de la
gestante.

C aptulo 5

Test de 2 de Pearson (1 grado de libertad)


2Pearson calculado = 0,183 < 2Pearson tabulado

= 3,84

AZAR
2 = 0,183

Ho (hiptesis nula) = La inmunizacin frente al


virus de la rubeola NO est asociada al grupo
cultural de la gestante.
Error alfa
Ha

Ho
AZAR

2Pearson tabulado = 3,84

Pgina 387

C aptulo 5

Pgina 388

Pregunta de investigacin
Qu relacin existe entre el hbito tabquico y el cncer de mama?

Variable PREDICTORA
Cualitativa dicotmica
Hbito tabquico

Variable RESULTADO
Cualitativa dicotmica
Cncer de mama

Cul es la prueba estadstica ms adecuada?

C aptulo 5

Tabla de contingencia cncer de mama


versus tabaquismo

Variable RESULTADO
Cncer de mama

Variable PREDICTORA

Si

No

Total

Fumadora

15

20

35

No fumadora

10

40

50

Total

25

60

85

Clculos del
programa
estadstico tabla
2x2
2Pearson

Valor

Grados de libertad Contraste bilateral Contraste


unilateral

5,18

0,023

Correccin de
Yates

4,14

0,042

Razn de
verosimilitud

5,14

Test exacto de
Fisher
N Casos vlidos

0,023
1

85

0,030

0,021

Pgina 389

C aptulo 5

Test de 2 de Pearson (1 grado de libertad)


2Pearson calculado = 5,18 > 2Pearson tabulado

= 3,84

AZAR
Ha (hiptesis alternativa) = El hbito tabquico est
asociado al cncer de mama en las mujeres de mi estudio.
2 = 5,18
Error alfa
Ha

Ho
AZAR

2Pearson tabulado = 3,84

Pgina 390

C aptulo 5

Pgina 391

Pregunta de investigacin
El hbito tabquico de los alumnos del I curso de metodologa de
investigacin depende del sexo?
Variable PREDICTORA
Cualitativa dicotmica
Sexo de los alumnos

Variable RESULTADO
Cualitativa dicotmica
Hbito tabquico

Cul es la prueba estadstica ms adecuada?

C aptulo 5

Pgina 392

Test de 2 de Pearson
Alumnos del curso

Variable RESULTADO

Variable PREDICTORA

Fumador

No fumador

Total

Masculino

28

33

Femenino

18

10

28

38

61

Total

23

Ho (hiptesis nula) = El hbito tabquico es independiente de sexo del alumno


del I curso de Metodologa de Investigacin.
Ha (hiptesis alternativa) = El hbito tabquico depende del sexo del alumno
del I curso de Metodologa de Investigacin.

C aptulo 5

Test de 2 de Pearson (1 grado de libertad)

2Pearson calculado = 15,57 > 2Pearson tabulado

= 3,84

AZAR
Ha (hiptesis alternativa) = El hbito tabquico depende del
sexo de alumno del I curso de Metodologa de Investigacin. Es
decir hay diferencias en el hbito tabquico en funcin del sexo.
2 = 15,57
Error alfa
Ha

Ho
AZAR

2Pearson tabulado = 3,84

Pgina 393

C aptulo 5

Pgina 394

Test de 2 de Pearson
Resumen del procesamiento informtico de los datos
Clculos del
programa
estadstico
2Pearson (*)

Valor

Grados de libertad Contraste bilateral Contraste


unilateral

15,57

0,000

Correccin de
Yates

13,54

0,000

Razn de
verosimilitud

16,28

Test exacto de
Fisher
N Casos vlidos

0,000
1

0,000

0,000

61

(*) 0 casillas (0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 10,56
Ha (hiptesis alternativa) = El hbito tabquico depende del sexo de alumno del I curso de Metodologa de
Investigacin. Es decir, hay diferencias en el hbito tabquico en funcin del sexo.

C aptulo 5

Pgina 395

Pregunta de investigacin
El hbito tabquico es homogneo en los alumnos del II curso de
metodologa de investigacin en funcin del sexo?
Variable PREDICTORA
Cualitativa dicotmica
Sexo de los alumnos

Variable RESULTADO
Cualitativa dicotmica
Hbito tabquico

Cul es la prueba estadstica ms adecuada?

C aptulo 5

Alumnos del curso

Variable RESULTADO

Variable PREDICTORA

(+)

(-)

Total

Si

15

No

24

28

Total

32

11

43

Ho (hiptesis nula) = El hbito tabquico es homogneo en hombres y


mujeres del II curso de Metodologa de Investigacin.
Ha (hiptesis alternativa) = El hbito tabquico NO es homogneo en
hombres y mujeres del II curso de Metodologa de Investigacin.

Test de 2 de Pearson

Pgina 396

C aptulo 5

Test de 2 de Pearson (1 grado de libertad)

2Pearson calculado = 5,38 > 2Pearson tabulado

= 3,84

AZAR
Ha (hiptesis alternativa) = El hbito tabquico NO es homogneo en hombres

y mujeres del II curso de Metodologa de Investigacin. Es decir hay diferencias


en el hbito tabquico en funcin del sexo.

2 = 5,38
Error alfa
Ha

Ho
AZAR

2Pearson tabulado = 3,84

Pgina 397

C aptulo 5

Pgina 398

Mito 1: La sonrisa de la esfinge

Se cumplen todos lo requisitos para el uso del test de Pearson?


2

He observado que en uno de los casilleros el valor obtenido es inferior a 5


observaciones.
Cmo justificas el empleo del test de Pearson?
2

La correccin de Yates permite analizar si dos variables dicotmicas estn


asociadas cuando la muestra a estudiar es pequea y no se cumplen las
2
condiciones necesarias para que la aplicacin del test Pearson sea
2
adecuada (uno de las casillas es inferior a 5). El test de Pearson exige que
todos los valores esperados de las celdas en una tabla de contingencia sean
mayores de 5.

C aptulo 5

Pgina 399

Test de 2 de Yates:
Correccin de continuidad
En la frecuencia esperada en una de las cuatro celdas es menor de 5, por
lo que NO resulta adecuado aplicar el test 2 Pearson , aunque s el test
de Yates. Las variables sexo y tabaquismo son independientes, porque la
probabilidad asociada a los datos del estudio (p = 0,051) es inferior a 0,05
(error alfa). Por tanto no podemos descartar la hiptesis nula (Ho).
Ho (hiptesis nula) = El hbito tabquico es homogneo en hombres y
mujeres del II curso de Metodologa de Investigacin
Regla de Decisin: Frecuencias esperadas
3

Fisher

Yates

Pearson

C aptulo 5

Resumen del procesamiento informtico de los datos


Clculos del
programa
estadstico

Valor

Grados de libertad

Contraste bilateral

2Pearson (*)

5,38

0,020

Correccin de
Yates

3,81

0,051

Razn de
verosimilitud

5,21

Test exacto de
Fisher
N Casos vlidos

Contraste unilateral

0,022
1

0,031

0,027

43

(*) 1 casillas (25%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 3,84

Ho (hiptesis nula) = El hbito tabquico NO depende del sexo de alumno del I curso
de Metodologa de Investigacin. Es decir NO hay diferencias en el hbito tabquico en
funcin del sexo.

Pgina 400

C aptulo 5

Test exacto de Fisher

Variable RESULTADO
Variable PREDICTORA

(+)

(-)

Total

Si

a+b

c+d

a+c

b+d

No
Total

(a + b)! * (c + d)! * (a + c)! * (b + c)!


n! * a! * b! * c! * d!

Pgina 401

C aptulo 5

Pgina 402

Pregunta de investigacin
El hbito tabquico es homogneo en los alumnos del III curso de
metodologa de investigacin en funcin del sexo?
Variable PREDICTORA
Cualitativa dicotmica
Sexo de los alumnos

Variable RESULTADO
Cualitativa dicotmica
Hbito tabquico

Cul es la prueba estadstica ms adecuada?

C aptulo 5

Alumnos del curso

Variable RESULTADO

Variable PREDICTORA

Fumador

Masculino
Femenino
Total

No fumador

Total

10

10

17

Ho (hiptesis nula) = El hbito tabquico es homogneo en hombres y


mujeres del III curso de Metodologa de Investigacin.
Ha (hiptesis alternativa) = El hbito tabquico NO es homogneo en
hombres y mujeres del III curso de Metodologa de Investigacin.

Correccin de continuidad de Yates


Test de 2 de Pearson

Pgina 403

C aptulo 5

Test de 2 de Pearson (1 grado de libertad)


2Pearson calculado = 4,49 > 2Pearson tabulado

= 3,84

AZAR
Ha (hiptesis alternativa) = El hbito tabquico NO es homogneo en
hombres y mujeres del III curso de Metodologa de Investigacin. Es decir
hay diferencias en el hbito tabquico en funcin del sexo.

2 = 4,49
Error alfa
Ha

Ho
AZAR

2Pearson tabulado = 3,84

Pgina 404

C aptulo 5

Pgina 405

Mito 1: La sonrisa de la esfinge

Se cumplen todos lo requisitos para el uso del test de 2 Pearson?


He observado que en varios casilleros el valor es igual o inferior a 5
observaciones.
Cmo justificas el empleo del test de 2 Pearson?
El test exacto de Fisher permite analizar si dos variables dicotmicas estn
asociadas cuando la muestra a estudiar es demasiado pequea y no se
cumplen las condiciones necesarias para que la aplicacin del test 2
Pearson sea adecuada. Estas condiciones exigen que los valores esperados
de las celdas en una tabla de contingencia sean mayores de 5.

C aptulo 5

Pgina 406

Test exacto de Fisher


En esta tabla a=2, b=5, c=8 y d=2. La frecuencia esperada en dos de las
cuatro celdas es menor de 5, por lo que NO resulta adecuado aplicar el test
2 Pearson, ni la correccin de Yates, aunque s el test exacto de Fisher. Si las
variables sexo y tabaquismo fuesen independientes, la probabilidad asociada
a los datos que han sido observados vendra dada por p = 0,058 (bilateral).
Ho (hiptesis nula) = El hbito tabquico es homogneo en hombres y
mujeres del III curso de Metodologa de Investigacin.
Regla de Decisin: Frecuencias esperadas
3

Fisher

Yates

Pearson

C aptulo 5

Clculos del
programa
estadstico
2Pearson

Valor

Grados de libertad Contraste bilateral Contraste


unilateral

4,49

0,034

Correccin de
Yates

2,62

0,105

Razn de
verosimilitud

4,65

Test exacto de
Fisher
N Casos vlidos

Pgina 407

0,031
1

0,058

0,052

17

(*) 3 casillas (75%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 2,88.
En ambos casos la Ho es la misma: la prevalencia de tabaquismo es igual en hombres y mujeres (Ho). En
el contraste unilateral la hiptesis alternativa (Ha) dice de que la prevalencia es mayor en las mujeres que
en los hombres (p=0,052). Cuando el planteamiento se hace con una perspectiva bilateral, la hiptesis
alternativa (Ha) consiste en asumir que existen diferencias en la prevalencia de tabaquismo entre sexos,
pero sin especificar de antemano en qu sentido se producen dichas diferencias, (p=0,058), que tampoco
es significativo. Las dos formas de clculo nunca proporcionan los mismos resultados. El contraste
unilateral (ms exigente) siempre resultar en un valor de p menor al contraste bilateral. En ambos casos, y
a la vista de los resultados del programa estadstico, NO existe evidencia estadstica de asociacin entre el
sexo y el hbito tabquico en los alumnos del curso de metodologa de investigacin de mi estudio.

C aptulo 5

Pgina 408

Pregunta de investigacin
Qu utilidad clnica tiene la prueba diagnstica X en el diagnstico
clnico de una determinada enfermedad E?
Objetivo: Evaluacin de la prueba X en el diagnstico de la enfermedad E.
Tcnica analtica a valuar
PRUEBA X

Tcnica de referencia
(diagnstico definitivo)
ENFERMEDAD E

Cul es el test estadstico ms acertado?

C aptulo 5

Pgina 409

Razn de Verosimilitud de 2
- Si la proporcin o frecuencia observada fo es en realidad igual a la
proporcin esperada fe segn la hiptesis nula (Ho), las 2 probabilidades
calculadas sern iguales y su razn ser igual a 1.
- Cuanto mayor sea la diferencia entre fo y fe, mayor ser la razn entre
ambas. La razn de estas 2 probabilidades o verosimilitudes puede utilizarse
como estadstico para medir el grado de ajuste entre las frecuencias
observadas y las esperadas.
- Esta prueba se calcula de la siguiente manera:

RV2 = 2 * fo * ln fe

fo

C aptulo 5

Razn de Verosimilitud de 2
Estudio
Casos - Controles

Diagnstico definitivo

Prueba X

Enfermos

Sanos

Total

Positiva (+)

9 (2,1%)

19 (4,4%)

28 (6,5%)

Negativa (-)

67 (15,7%)

335 (93,5%)

402 (93,5%)

Total

76 (17,7%)

354 (82,3)

430

Ho (hiptesis nula) = Los resultados de la prueba diagnstica X NO estn


relacionados con el diagnstico definitivo.
Ha (hiptesis alternativa) = Los resultados de la prueba diagnstica X estn
relacionados con el diagnstico definitivo.

Pgina 410

C aptulo 5

Pgina 411

Razn de Verosimilitud de 2
Clculos del
programa
estadstico

Valor

Grados de libertad

Contraste bilateral

2Pearson

4,309

0,038

Correccin de
Yates

3,311

0,069

Razn de
verosimilitud

3,706

Test exacto de
Fisher
N Casos vlidos

Contraste unilateral

0,054
1

0,067

0,041

430

A pesar de que el test de 2 de Pearson es significativo (p < 0,05) no podemos rechazar


la hiptesis nula ya que la razn de verosimilitud es mayor de 0,05 (diseo de casos y
controles).
Ho (hiptesis nula) = Los resultados de la prueba diagnstica X NO estn relacionados con
el diagnstico definitivo

C aptulo 5

Un equipo de traumatlogos desarrollaron una nueva tcnica quirrgica


para el reemplazo de la cabeza del fmur que suponan superior a la
tcnica tradicional.
Existen diferencias significativa respecto al porcentaje de complicaciones
postoperatorias inmediatas?
Ho (hiptesis nula) = No hay diferencia entre ambas tcnicas de
quirrgicas.
Ha (hiptesis alternativa) = S existe diferencia entre ambas tcnicas de
quirrgicas.
Tcnica CLSICA

Tcnica NUEVA

Pgina 412

C aptulo 5

Variable resultado

Variable predictora Tipo de ciruga

Complicaciones
INMEDIATAS

Tcnica CLSICA

Tcnica NUEVA

Dao nervioso

485 (50%)

28 (26,4%)

Hemorragia

285 (29,4%)

16 (15,1%)

Desplazamiento

52 (5,4%)

4 (3,8%)

Ninguna

148 (15,3%)

58 (54,7%)

Total

970

106

Cul es el test estadstico ms acertado?


Test de 2 de Pearson

2Pearson = 129,97

p < 0,0001

Existe asociacin

Pgina 413

C aptulo 5

p < 0,0001

Frecuencia absoluta(%)

2Pearson = 129,97

Complicaciones postquirrgicas
INMEDIATAS

Pgina 414

C aptulo 5

Test de 2 de Pearson

Grados de libertad = [ K - 1] [F - 1] = (2-1) (4 -1) = 3

2Pearson calculado = 129,97 > 2Pearson tabulado =


2 = 129,97
Ho

AZAR

7,81

AZAR

Ha
7,81

Ha (hiptesis alternativa) = La frecuencia de las complicaciones postquirrgicas


inmediatas en la nueva tcnica NO eran iguales que en la tcnica clsica.

Pgina 415

C aptulo 5

Pgina 416

Pregunta de investigacin
Qu relacin existe entre el pas de procedencia y la prevalencia de
infeccin tuberculosa en el colectivo de inmigrantes del campamento
de Calamocarro de Ceuta?
Variable PREDICTORA
Cualitativa policotmica
Pases africanos de origen

Variable RESULTADO
Cualitativa dicotmica
Infeccin tuberculosa

Cul es el test estadstico ms adecuado?


Fernndez SanFrancisco T, Daz Portillo J, Snchez Romero JM et al. PREVALENCIA DE INFECCIN
TUBERCULOSA EN LA POBLACIN DE INMIGRANTES EN CEUTA. Rev Esp Salud Pblica 2001; 75:
501-558.

C aptulo 5

Test de 2 de Pearson
Pas de procedencia

Prevalencia

Argelia

133

25,6

Camern

128

48,4

Costa de marfil

18

27,8

Gambia

107

11,2

Guinea Bissau

186

26,3

Liberia

105

27,4

Mali

291

32,7

Mauritania

55

24,1

Nigeria

597

29,1

R.D. Congo

146

34,0

R. Guinea

45

65,1

Sierra Leona

177

20,8

2Pearson= 165; p<0,00001

Existe asociacin

Pgina 417

C aptulo 5

Pas africano de procedencia del inmigrante

Gambia

11%
20%

Sierra Leona
Mauritania

24%

Argelia

Guinea Bissau

25%
26%

Liberia

27%

Costa de marfil

28%
29%

Nigeria

33%

Mali

34%

R.D. Congo
Camern

48%

R. Guinea

65%

Prevalencia de infeccin tuberculosa


Fernndez SanFrancisco T, Daz Portillo J, Snchez Romero JM et al. PREVALENCIA DE INFECCIN
TUBERCULOSA EN LA POBLACIN DE INMIGRANTES EN CEUTA. Rev Esp Salud Pblica 2001; 75:
501-558.

Pgina 418

C aptulo 5

Pgina 419

Pregunta de investigacin
Existen diferencias en la prevalencia de infeccin tuberculosa en el
colectivo de inmigrantes segn la ciudad de destino (Ceuta, Barcelona, Toledo)?
Variable PREDICTORA
Cualitativa policotmica
Destino
- Ceuta
- Barcelona
- Toledo

Variable RESULTADO
Cualitativa dicotmica
Infeccin tuberculosa

Cul es el test estadstico ms adecuado?

C aptulo 5

Pgina 420

Test de 2 de Pearson
Variable RESULTADO
Prueba de Mantoux
Variable PREDICTORA

(+)

(-)

Total

Ceuta

722 (32,6%)

1501

2223

Barcelona

506 (34%)

983

1489

Toledo

75 (27,7%)

269

344

2Pearson= 19,29; p = 0,000065

Ha: Existen diferencias en la prevalencia de infeccin tuberculosa en el colectivo de inmigrantes segn la


ciudad de destino (Ceuta, Barcelona, Toledo).

C aptulo 5

Pgina 421

Fernndez Sanfrancisco MT, Daz Portillo J, Snchez Romero JM, et al. Prevalencia de infeccin
tuberculosa en la poblacin inmigrante de Ceuta. Rev Esp Salud Pblica 2001; 75: 551-558.
Duran E, Cabezos J, Ros M, et al. Tuberculosis en los inmigrantes recin llegados a Barcelona. Med Clin
(Barc) 1996; 106: 525-528.
Alonso Moreno FJ, Garca Bajo MC, Lougedo Caldern MJ, et al. Prevalencia de infeccin tuberculosa en
las personas inmigrantes del rea sur de Toledo. Rev Esp Salud Pblica 2004; 78: 593-600.

C aptulo 5

Pgina 422

Realidad 3
...de lo estadsticamente significativo a lo clnicamente relevante
Realidad 3: ...de lo
estadsticamente significativo a lo
clnicamente relevante.

Es clnicamente relevante?

Es estadsticamente significativo?

S (xito)

No (fracaso)

S (p < 0,05)

Clnicamente relevante

Clnicamente irrelevante (p < 0,05)

Estadsticamente significativo

Estadsticamente significativo

Error Alfa?
No (p > 0,1)

Clnicamente relevante

Clnicamente irrelevante

Estadsticamente NO
significativo

Estadsticamente NO significativo

Error Beta?

C aptulo 5

Pgina 423

Pregunta de investigacin
Qu relacin y qu grado de asociacin existe entre el grupo cultural/religioso de la ciudad de Ceuta y la prevalencia de inmunizacin
frente a Toxoplasma goondi en la poblacin gestante?
Variable PREDICTORA
Cualitativa policotmica
Grupo cultural:
- Cristianas
- Musulmanas

Variable RESULTADO
Cualitativa dicotmica
Infeccin Toxoplasma goondi

Cul es el test estadstico ms adecuado?


Daz Portillo J, Torres E, Vadillo Andrade J. SEROEPIDEMIOLOGA DE LA TOXOPLASMOSIS EN UNA
POBLACIN GESTANTE DE CEUTA. Revista de Diagnstico Biolgico 1998; 47: 106-116.

C aptulo 5

Test de 2 de Pearson
Variable predictora Religin
Variable resultado
Inmunizacin

Cristiana

Musulmana

(+)

112

220

(-)

210

148

2Pearson= 43,99; p<0,0000001

Existe asociacin

No cuantifica el grado de intensidad de la asociacin.

Pgina 424

C aptulo 5

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar

DESPUS

ANTES

XITO (+)

FRACASO (-)

XITO (+)

FRACASO (-)

2McMemar

[ ( B C ) 1 ]2

B+C

Pgina 425

C aptulo 5

Pgina 426

Existen evidencias de un mejor efecto analgsico en los dos


frmacos protocolizados para el clico nefrtico?
- Diseo APAREADO
- Un solo grupo de pacientes (n=20) con clico nefrtico recidivante (dos
episodios de clico nefrtico).
- Dos mediciones repetidas (antes y despus).
- Gran potencia estadstica (mnima variabilidad aleatoria).
- Hiptesis nula Ho: la eficacia de ambos analgsicos es la misma Metamizol
= Ketorolaco
Test de McNemar

C aptulo 5

N = 20 pacientes

KETOROLACO

METAMIZOL

Pgina 427

C aptulo 5

Test de McNemar para datos apareados


McNemar

METAMIZOL

KETOROLACO

XITO = 1

FRACASO = 0

XITO = 1

FRACASO = 0

2McMemar

Z McNemar =

[ ( B C ) 1 ]2

B+C
(B C)1

B+C

Pgina 428

C aptulo 5

Test de McNemar para datos apareados


McNemar

METAMIZOL

KETOROLACO

XITO = 1

FRACASO = 0

XITO = 1

FRACASO = 0

McMemar =

[ ( 9 2 ) 1 ]2

9+2

= 3,27 p > 0,05

Pgina 429

C aptulo 5

Procesamiento informtico de los datos


Test de McNemar para datos apareados
Valor

Significacin bilateral (*)

Prueba de McNemar

3,27

0,065

N casos vlidos

20

(*) Utilizada la distribucin binomial


Hiptesis nula Ho: La eficacia de ambos analgsicos es la misma, es decir
Metamizol = Ketorolaco
Es posible un error ?
Qu ocurre si aumentamos el tamao muestral?

Pgina 430

C aptulo 5

N = 30 pacientes

KETOROLACO

METAMIZOL

Pgina 431

C aptulo 5

Test de McNemar para datos apareados


McNemar

METAMIZOL

KETOROLACO

XITO = 1

FRACASO = 0

XITO = 1

11

14

FRACASO = 0

McMemar =

[ ( 14 3 ) 1 ]2

14 + 3

= 5,88
p = 0,013

Pgina 432

C aptulo 5

Procesamiento informtico de los datos


Test de McNemar para datos apareados
Valor

Significacin bilateral (*)

Prueba de McNemar

5,88

0,013

N casos vlidos

30

(*) Utilizada la distribucin binomial


Hiptesis alternativa Ha: La eficacia de ambos analgsicos es NO la misma,
es decir Metamizol Ketorolaco

Pgina 433

C aptulo 5

Pgina 434

Pregunta de investigacin
Existen evidencias de una mejora en los conocimientos
tericos de Metodologa de investigacin en los alumnos
despus del curso?
Examen de 14 preguntas a los 8 alumnos antes y despus de realizar el curso
Aprobado: [ > 7 respuestas correctas de 14 ] = 1
Suspenso: [ < 8 respuestas correctas de 14 ] = 0
DESPUS del curso
ANTES del curso

APROBADO (> 7)

SUSPENSO (< 8)

APROBADO (> 7)

SUSPENSO (< 8)

C aptulo 5

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar

DESPUS del curso

ANTES del curso

APROBADO (< 7)

SUSPENSO (< 8)

APROBADO (< 7)

SUSPENSO (< 8)

2McMemar

[ ( B C ) 1 ]2

Z McNemar =

B+C
(B C)1

B+C

Pgina 435

C aptulo 5

Existen evidencias de una mejora en los conocimientos


tericos de metodologa de investigacin en los alumnos
despus del curso?
N del Alumno

Evaluacin ANTES del curso

Evaluacin DESPUS del curso

APROBADO (10)

APROBADO (14)

SUSPENSO (7)

APROBADO (14)

SUSPENSO (7)

APROBADO (14)

SUSPENSO (5)

APROBADO (14)

SUSPENSO (4)

APROBADO (13)

SUSPENSO (3)

APROBADO (13)

SUSPENSO (2)

APROBADO (13)

SUSPENSO (2)

APROBADO (11)

Cul es el test estadstico ms acertado?

Pgina 436

C aptulo 5

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar

DESPUS del curso

ANTES del curso

APROBADO (< 7)

SUSPENSO (< 8)

APROBADO (< 7)

SUSPENSO (< 8)

McMemar =

[ ( 0 7 ) 1 ]2

0+7

= 9,14

Pgina 437

C aptulo 5

Z McNemar =

Z McNemar =

(B C)1

B+C

(0 7)1

0+7

Valor

Z95%

1,96

0,05

Z98%

2,32

0,02

Z99%

2,56

0,01

Z99,5%

3,29

0,005

= 3,03 > Z 99% = 2,56

Conclusin: Como el estadstico Z calculado 3,03 es superior a Z tabulado


para un error alfa de 0,01 (2,56), podemos decir que las dos variables
evaluadas NO son independientes, sino que estn asociadas (p<0,01), es
decir, la accin formadora mejora los conocimientos de los alumnos.

Pgina 438

C aptulo 5

Colesterol total (mg/dl) al nacimiento

110

80

50

20
80

130

180

Colesterol total (mg/dl) durante el segundo ao de vida

230

Pgina 439

Pgina 440

C aptulo 5

Colesterol total (mg/dl) al nacimiento

110

21/108 (19,4%)
14/61 Cristianos (23,0%)
6/44 Musulmanes (13,6%)

8/108 (7,4%)
4/61 Cristianos (6,5%)
4/44 Musulmanes (9,1%)

80
P75

50

64/108 (59,5%)
34/61 Cristianos (55,7%)
28/44 Musulmanes (63,6%)

20
80

130

14/108 (13,9%)
9/61 Cristianos (14,7%)
6/44 Musulmanes (13,6%)
180
P75

Colesterol total (mg/dl) durante el segundo ao de vida

230

C aptulo 5

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar

SEGUNDO AO DE VIDA

NEONATOS
CT > P75

CT P75

CT P75

2McMemar

CT > P75

Z McNemar =

[ ( B C ) 1 ]2

B+C
(B C)1

B+C

Pgina 441

C aptulo 5

Pgina 442

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar
NEONATOS
CT > P75
CT P75

SEGUNDO AO DE VIDA
CT > P75

CT P75

14

64

21

Test de McNemar para datos apareados


Valor

Significacin bilateral

Significacin unilateral

Prueba de McNemar

1,03

0,311

0,155

N casos vlidos

108

C aptulo 5

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar
NEONATOS
CT > P75
CT P75

McMemar =

SEGUNDO AO DE VIDA
CT > P75

CT P75

14

64

[ ( 21 14 ) 1 ]2

21 + 14

21

= 1,03

Jacobo Daz Portillo .Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta, Tesis doctoral. Facultad de Medicina de la Universidad de Cdiz. 1997

Pgina 443

C aptulo 5

Z McNemar =

Z McNemar =

(B C)1

B+C
( 21 14 ) 1

21 + 14

Valor

Z95%

1,96

0,05

Z98%

2,32

0,02

Z99%

2,56

0,01

Z99,5%

3,29

0,005

Pgina 444

= 1,014

Conclusin: Como el estadstico Z calculado 1,014 es INFERIOR a Z tabulado


para un error alfa de 0,05 (1,96), podemos decir que las dos variables
evaluadas son independientes, es decir, NO estn asociadas, y por tanto no
hay cambios importantes en la distribucin del colesterol total al pasar del
nacimiento al segundo ao de vida. Este comportamiento tambin se repite
en los dos grupos culturales (cristianos y musulmanes).

C aptulo 5

Existen evidencias de un mejor efecto antitusgeno en los 3 frmacos ensayados?


TOS
Si (1)

No (0)

RESPUESTA A
TOS
Si (1)

No (0)

RESPUESTA B
TOS
Si (1)

Cul es el test estadstico ms adecuado?

No (0)

RESPUESTA C

Pgina 445

C aptulo 5

Pgina 446

Q de Cochran
Para tres o ms muestras dependientes
- La prueba Q de Cochran es una extensin de la prueba de McNemar, que
se utiliza en los modelos experimentales con 3 o ms muestras dependientes
o relacionadas entre s, es decir, esta poblacin sirve como su propio control,
en el que existe un perodo previo y otro ulterior; adems, el tipo de escala
debe ser nominal.
- El valor calculado en la prueba Q de Cochran se distribuye igual que la ji
cuadrada, por lo cual el smbolo utilizado ser X 2Q.

Donde:
X 2Q = estadstico ji cuadrada de la prueba Q de Cochran.
K = nmero de tratamientos.
Gn = nmero total de respuestas de cambio de cada tratamiento o columna.
Lc = nmero total de respuestas de cambio por individuo de la muestra o hileras.

C aptulo 5

Pgina 447

25 pacientes reciben 3 frmacos para mejorar su tos


Paciente

Frmaco A Frmaco B

Frmaco C

Paciente

Frmaco A Frmaco B

Frmaco C

15

16

17

18

19

20

21

22

23

10

24

11

25

12

13

14

0 = Mejora la tos
1 = NO mejora la tos

C aptulo 5

Media

DE

Mnimo

Mximo

Frmaco A

25

0,60

0,500

Frmaco B

25

0,65

0,478

Frmaco C

25

0,48

0,510

Valores

Test estadsticos

250

Frmaco A

10

15

Q de Cochran

2,111

Frmaco B

17

gl

Frmaco C

13

12

Significacin

0,348

Grados de libertad = [ K - 1] [F - 1]

Hiptesis nula Ho: No hay diferencia entre los 3 frmacos para evitar la tos.
Hiptesis alternativa Ha: Hay diferencia entre los 3 frmacos para evitar la tos.
Conclusiones: No hay diferencias estadsticamente significativas entre los 3 frmacos
para evitar la tos en los pacientes.

Pgina 448

C aptulo 5

Pgina 449

Datos categricos
Cualitativa versus cualitativa ORDINALES
- Test de 2 de tendencia lineal
- Tau-B de Kendall o Stuart
- Tau-C de Kendall
- Gamma de Goodman y Kruskal
- D de Somers
- Correlacin de Spearman
Estos estadsticos NO se pueden utilizar cuando alguna de las variables sea
NOMINAL

C aptulo 6

Captulo 6
Publicacin Bioestadstica: Anlisis bivariante.
Test de contraste de hiptesis.
Cualitativa versus cualitativa.
Medidas de asociacin.

Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Pgina 450

C aptulo 6

Datos categricos:
Cualitativa versus cualitativa. Nominales
- Test de 2 de Pearson
- Relacin entre dos variables cualitativas nominales o policotmicas
- Comparacin de proporciones
- Correccin de Yates
- Test exacto de Fisher
- Valores esperados menores de 5
- Razn de verosimilitud
- Evaluacin de pruebas diagnsticas
- Test de 2 de McNemar
- Datos apareados o emparejados
- Coeficiente PHI ()
- V de Cramer
- Coeficiente de contingencia
- Coeficiente de incertidumbre
- Tau de Goodman y Kruskal
- Lambda de Goodman y Kruskal (coeficiente de predictibilidad de Guttman)

Pgina 451

C aptulo 6

Datos categricos:
Cualitativa versus cualitativa. Ordinales
- Test de 2 de tendencia lineal
- Tau-B de Kendall o Stuart
- Tau-C de Kendall
- Coeficiente Gamma de Goodman y Kruskal
- D de Somers
- Correlacin de Spearman
Estos estadsticos NO se pueden
utilizar cuando alguna de las variables
sea NOMINAL

Pgina 452

C aptulo 6

Pgina 453

Medidas de asociacin
Son indicadores estadsticos que miden la FUERZA o INTENSIDAD
con la que una determinada enfermedad o evento de salud (VARIABLE
RESULTADO)est asociada o relacionada con un determinado factor (que se
presume como su causa, VARIABLE PREDICTORA).
Estadstico

Transversales

Cohortes

Casos-controles

OR (Odds ratio)

Limitaciones

NO

SI

RR (Riesgo Relativo)

NO

SI

NO

Q de Yule

SI

SI

SI

Coeficiente PHI

SI

SI

SI

V de Cramer

SI

SI

SI

Coeficiente de contingencia

SI

SI

SI

Lambda

SI

SI

SI

Tau de Goodman y Kruskal

SI

SI

SI

Coeficiente de incertidumbre

SI

SI

SI

Gamma

SI

SI

SI

D de Somers

SI

SI

SI

Tau-b de Kendall

SI

SI

SI

C aptulo 6

Test de 2 de independencia de Pearson

CONTRASTES A POSTERIORI

Test de la Q de Yule

Nominales
Tablas = 2 x 2

Coeficiente PHI
V de Cramer

No es un test de contraste de
hiptesis (no calcula p)
Tablas = 2 x 2

Nominales
Tablas > 2 x 2

Coeficiente Lambda

Nominales
Tablas > 2 x 2

Coeficiente de incertidumbre
Coeficiente Tau-b de Kendall
Coeficiente Gamma
D de Somers

Nominales
Tablas > 2 x 2
Ordinales
Tablas > 2 x 2

Ordinales
Tablas > 2 x 2
Ordinales
Tablas > 2 x 2

Pgina 454

C aptulo 6

Test de la Q de Yule
Variable predictora Religin
Variable resultado
Inmunizacin

Cristiana

Musulmana

(+)

(-)

Q =

[ (A * D) (B * C) ]
[ (A * D) + (B * C) ]

Pgina 455

C aptulo 6

Test de la Q de Yule
Coeficiente Gamma
- Interpretacin:
-Q=0
-Q>0
-Q<0

independencia
asociacin positiva
asociacin negativa

- Intervalo de Q: (-1, +1)


- Informacin:
- Medida de la intensidad de la asociacin
- Sentido de la misma

Pgina 456

C aptulo 6

Pgina 457

Caractersticas de la Q de Yule
- Medida de asociacin.
- Valores mayores de 0 (asociacin positiva).
- Valores menores de 0 (asociacin negativa).
- Valor = 0 o prximos a 0 (es probable que no exista asociacin).
- Vlida para cualquier tipo de Estudios (diseo).
- Alcanza valores extremos (+1, -1) bajo condiciones de asociacin perfectas.
- Es independiente de los cambios de ESCALA de filas y columnas.
- Si se intercambian entre si las filas o las columnas se mantiene la magnitud
de la INTENSIDAD de la asociacin, slo cambia la direccin de la misma, es
decir el signo de la Q.
- Es ms valida con un test previo de contraste de hiptesis que indique
relacin entre ambas variables.

C aptulo 6

Test de la Q de Yule
Coeficiente Gamma
Rubeola

Religin

Variable resultado
Inmunizacin

Cristiana

Musulmana

(+)

279 (87,2%)

372 (86,1%)

(-)

41

60

Q =

[ (279 * 60) (372 * 41) ]

= 0,047

[ (279 * 60) + (372 * 41) ]

Gamma (Q de Yule)

EEk

0,047

0,113

T aprox

0,430

p
0,667

Pgina 458

C aptulo 6

Pgina 459

Mito 1: La sonrisa de la esfinge

La Q de Yule es un test que cuantifica la magnitud de la intensidad de la


asociacin entre dos variables cualitativas, pero NO es un test de contraste
de hiptesis, y por tanto, que para usarlo se debe cumplir previamente la
asociacin estadstica entre ambas variables. Se cumple?
He observado en tus resultados anteriores que el test de contraste de
hiptesis de 2 Pearson tiene un valor de tan slo 0,18, con p = 0,67. Cmo
justificas el empleo de la Q de Yule si NO existe asociacin estadstica entre
ambas variables?

C aptulo 6

Test de la Q de Yule
Toxoplasma goondi

Religin

Variable resultado
Inmunizacin

Cristiana

Musulmana

(+)

112 (34,8%)

220 (59,8%)

(-)

210

148

Q =

[ (112 * 148) (220 * 210) ]


[ (112 * 148) + (220 * 210) ]

Gamma (Q de Yule)

EEk

- 0,47

0,041

T aprox

- 6,780

p
0,000

= 0,47

Pgina 460

C aptulo 6

Q = 0,47

Q = 0,70

Pgina 461

Q = 0,72

59,8

Seroprevalencia (%)

53,6

43,3
34,8

17,3
11,0

Figura .- Evolucin de la seroprevalencia de la toxoplasmosis en gestante de Ceuta (periodos 1994, 2004,


2010) (Q= Q de Yule; gamma; p < 0,001)

C aptulo 6

Pgina 462

Ejercicio: Qu grado de asociacin existe entre el infarto


de miocardio y el sexo del paciente?
Q de Yule

Acontecimiento de infarto

Sexo

(+)

(-)

Hombre

32

10

Mujer

11

27

Q =

[ (32 * 27) (11 * 10) ]


[ (32 * 27) + (11 * 10) ]

Gamma (Q de Yule)

EEk

0,774

0,102

T aprox

4,782

= 0,77

p
0,000

C aptulo 6

Pgina 463

Ejercicio: Qu grado de asociacin existe entre el infarto


de miocardio y el sexo del paciente?
Q de Yule
El valor de 0,77 sugiere un grado de asociacin entre los factores sexo y
acontecimiento del infarto bastante elevado, ya que 0,77 est prximo a
1, y adems indica que dicha asociacin es positiva, es decir los varones
desarrollan con ms frecuencia el infarto que las mujeres.

C aptulo 6

Pgina 464

Pregunta de investigacin
En qu grupo cultural/religioso es mayor la prevalencia de inmunizacin frente a Toxoplasma goondi en la poblacin gestante de Ceuta?
Musulmanas o cristianas?
Variable PREDICTORA
Cualitativa policotmica
Grupo cultural:
- Cristianas
- Musulmanas

Variable RESULTADO
Cualitativa dicotmica
Infeccin Toxoplasma goondi

Cul es el test estadstico ms adecuado?


Daz Portillo J, Torres E, Vadillo Andrade J. SEROEPIDEMIOLOGA DE LA TOXOPLASMOSIS EN UNA
POBLACIN GESTANTE DE CEUTA. Revista de Diagnstico Biolgico 1998; 47: 106-116.

C aptulo 6

Coeficiente PHI ()

Variable predictora

Variable resultado

Positiva (+)

Negativa (-)

Total

Positiva (+)

a+b

Negativa (-)

c+d

Total

a+c

b+d

Coeficiente PHI

(a * d) (b * c)

(a + c) (b + d) (a + b) (c + d)

Pgina 465

C aptulo 6

Coeficiente PHI
Coeficiente PHI ()

Variable predictora

Variable resultado

Positiva (+)

Negativa (-)

Total

Positiva (+)

112 (34,8%)

220 (59,8%)

332

Negativa (-)

210

148

358

Total

322

368

690

Coeficiente es un test de contraste de hiptesis

43,99
690

p < 0,01

0,25

Pgina 466

C aptulo 6

Coeficiente PHI
Coeficiente PHI ()

Variable predictora

Variable resultado

Positiva (+)

Negativa (-)

Total

Positiva (+)

112 (34,8%)

220 (59,8%)

332

Negativa (-)

210

148

358

Total

322

368

690

(112 * 148) (220 * 210)

(112 + 210) (220 + 148) (112 + 220) (210 + 148)

= - 0,25

Ha: La inmunizacin a Toxoplasma se encuentra asociada a la cultura musulmana.

Pgina 467

C aptulo 6

Pgina 468

Coeficiente PHI

- Condiciones: Tablas tetracricas (2 x 2).


- Interpretacin:
- =0
- >0
- <0

independencia.
asociacin positiva.
asociacin negativa.

- Intervalo de : entre -1 y 1.
- Informacin: Es un test de contraste de hiptesis que ofrece una medida
de la intensidad de la asociacin. Cuando se acercan a cero, indican
independencia o asociacin muy dbil entre las variables. Cuando se acercan
a uno, indican una relacin ms fuerte o intensa entre las variables asociadas.

C aptulo 6

Pregunta de investigacin
El resultado del tratamiento depende del frmaco empleado?
La condicin de asintomtico se encuentra asociado al uso de
Mosaprida?
Variable PREDICTORA
Cualitativa policotmica
- Metoclopramida (n = 99)
- Cisaprida (n = 102)
- Mosaprida (n = 99)

Variable RESULTADO
Cualitativa dicotmica
- Asintomtico
- Sntomas
- Mejora clnica

Cul es el test estadstico ms adecuado?

Pgina 469

C aptulo 6

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer
Coeficiente de contingencia
Lambda
Tau de Goodman y Kruskal
Coeficiente de incertidumbre

Pgina 470

C aptulo 6

El resultado del tratamiento depende del frmaco


empleado?
Variable RESULTADO Resultado del tratamiento a la semana
Variable PREDICTORA
Tipo de medicamento

Asintomtico

Sintomtico

Mejora

Metoclopropamida

24 (8%)

54 (18%)

21 (7%)

Cisaprida

27 (9%)

18 (6%)

57 (19%)

Mosaprida

51 (17%)

27 (9%)

21 (7%)

2Pearson= 60,12

p = 0,000

Existe asociacin

Ha: El resultado del tratamiento depende del frmaco empleado


La condicin de asintomtico se encuentra asociado al uso de Mosaprida?

V de Cramer

Pgina 471

C aptulo 6

Pgina 472

V de Cramer

V=

n (k- 1)

V=

60,12
300 (3 -1)

Nominal por nominal

Valor del estadstico

Significacin (p)

Coeficiente PHI

0,448

0,000

V de Cramer

0,317

0,000

N de casos vlidos

0,317

300 pacientes

Ha: La condicin de asintomtico se encuentra asociado al uso de Mosaprida.

C aptulo 6

Pgina 473

V de Cramer
- Definicin: V de Cramer es una manera de calcular la correlacin en los cuadros que
tienen ms de 2x2 filas y columnas. Se utiliza como posterior a la prueba para determinar
la intensidad de la asociacin despus de que el test de chi-cuadrado ha sido significativa.
Chi-cuadrado, dice que existe una relacin significativa entre las variables, pero no dice
nada del grado de significancia ni de su importancia. V de Cramer es un post-test para dar
esta informacin adicional.
- Condiciones: Tablas de ms de 2 x 2. Cuando la tabla es de 2 x 2 (tetracrica), utilice el
coeficiente PHI.
- Interpretacin:
-V =0
independencia.
-V >0
asociacin positiva.
- Intervalo de V : entre 0 y 1.
- Informacin: Es una medida de la intensidad de la asociacin. Cuando se acercan a cero,
indican independencia o asociacin muy dbil entre las variables. Cuando se acercan a
uno, indican una relacin ms fuerte o intensa entre las variables estudiadas.
Cramer, H. (1999). Mtodos Matemticos de Estadstica, Princeton University Press.

C aptulo 6

Pgina 474

Limitaciones del test 2 de Pearson como medida de


asociacin
Una vez que tenemos hallado el valor del 2 podemos preguntarnos si existe
o no asociacin. No se puede emplear el valor de 2 como una medida de
asociacin ya que este aumenta con el tamao muestral. El valor absoluto de
2 no permite tener una idea clara de la fuerza de la asociacin ya que sus
valores no estn acotados en un intervalo definido.
Un coeficiente que s tiene la propiedad de que sus valores varen dentro de
un intervalo es el COEFICIENTE DE CONTINGENCIA.

Coeficiente de contingencia
El valor de este coeficiente nunca ser inferior a 0 ni superior a 1. El 0
corresponder a ausencia de asociacin, con 2 = 0. No en todos los casos
la dependencia extrema necesariamente debe dar 1, depender del nmero
de categoras k.

C aptulo 6

Pgina 475

Coeficiente de contingencia (C)


El coeficiente de contingencia se utiliza para saber la asociacin de variables
cualitativas NOMINALES, que tienen dos o ms categoras. Este coeficiente
requiere del clculo previo del estadstico 2 de Pearson.
Cmx =

k-1
k

C=

2
2 + n

Donde:
C = coeficiente de contingencia.
2 = valor de chi-cuadrado de Pearson calculado previamente.
n = tamao o nmero de la muestra.
C=0
Significa que NO hay asociacin.
C > 0,30
Indica una buena asociacin entre las variables.
Cmx No alcanza el valor 1 aunque las dos variables estn totalmente
relacionadas.

C aptulo 6

Pgina 476

Coeficiente de contingencia (C)


El coeficiente de contingencia se utiliza para saber la asociacin de variables
cualitativas NOMINALES, que tienen dos o ms categoras. Este coeficiente
requiere del clculo previo del estadstico 2 de Pearson.

C=

Cajustado =

Cmx =

2
2 + n
k-1
k

C aptulo 6

Pgina 477

La ADHERENCIA al curso de bioestadstica depende del


modelo docente utilizado (presencial, semipresencial o
online)?
Cursos semipresenciales

Presencial

Online (a distancia)

C aptulo 6

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer
Coeficiente de contingencia
Lambda
Tau de Goodman y Kruskal
Coeficiente de incertidumbre

Pgina 478

C aptulo 6

Pgina 479

Variable predictora TIPO DE CURSO


Variable resultado
Adherencia al curso

PRESENCIAL

ONLINE

semiPRESENCIAL

Seguimiento

190

170

180

Abandonos

10 (5%)

30 (15%)

20 (10%)

Total

200

200

200

2Pearson= 11,11

p = 0,004

Existe asociacin

Ha: La adherencia al curso es dependiente del tipo de modalidad de enseanza empleado.


El modelo PRESENCIAL se encuentra asociado a una mayor adherencia del alumno al
curso?

C aptulo 6

El modelo presencial se encuentra asociado a una mayor


adherencia del alumno al curso?
Variable predictora TIPO DE CURSO
Variable resultado
Adherencia al curso

PRESENCIAL

ONLINE

semiPRESENCIAL

Seguimiento

190

170

180

Abandonos

10 (5%)

30 (15%)

20 (10%)

Total

200

200

200

C=

2
2 + n

C=

11,11

11,11 + 600

0,135

C < 0,30

Ha: La adherencia al curso es mayor en la modalidad PRESENCIAL.

Pgina 480

C aptulo 6

Nominal por nominal

Valor del estadstico

Significacin (p)

Coeficiente de contingencia C

0,135

0,004

V de Cramer

0,136

0,004

N de casos vlidos

Cmx =

k-1
k

600 pacientes

Cmx =

C ajustado =

3-1
3
0,135

0,816

= 0,816

= 0,165 (16,5%)

Ha: La adherencia al curso es mayor en la modalidad PRESENCIAL.

Pgina 481

C aptulo 6

Pgina 482

Decisin: El coeficiente de contingencia como medida de asociacin para una escala


nominal, es una funcin de 2. La decisin de aceptar o rechazar la hiptesis se establece
mediante el valor de 2 = 11,11 con dos grados de libertad, y se obtiene una probabilidad
en su distribucin de p < 0,05. Entonces se acepta Ha y se rechaza Ho; adems, el
coeficiente 0,135 es distinto de 0, aunque muy lejos de su valor mximo (0,816), ya que
slo supone el 16,5% de dicho valor, y tambin est lejos del punto de corte (0,30) por lo
que la asociacin encontrada es dbil.

Grados de libertad = [ K - 1] [F - 1] = [ 3 1] [2 1] = 2
2 = 11,11
Ho

p = 0,004

Ha

AZAR

5,99

C aptulo 6

Interpretacin del coeficiente de contingencia


La asociacin existente entre la ADHERENCIA al curso del alumno y el
tipo de modalidad docente utilizada es verdadera, en la cual conforme
sea el tipo de modalidad empleada, cambia la frecuencia de abandonos
de manera significativa, siendo mayor el porcentaje de abandonos en el
modelo ONLINE, con un valor de coeficiente de contingencia de 0,135.
PRESENCIAL

Pgina 483

C aptulo 6

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer
Coeficiente de contingencia
Lambda
Tau de Goodman y Kruskal
Coeficiente de incertidumbre

Pgina 484

C aptulo 6

Pgina 485

Tau de Goodman y Kruskal


Al igual que el coeficiente de incertidumbre y lambda, el coeficiente Tau (de
Goodman y Kruskal) es una medida de asociacin basada en la reduccin
proporcional del error. Es una medida que expresa el grado de incertidumbre
que conseguimos reducir cuando utilizamos una variable para efectuar
pronsticos sobre otra.
Nominal por nominal

Valor Tau

EE

Significacin

Tipo de modalidad de curso variable resultado

0,009

0,005

0,004

Rendimiento del curso variable resultado

0,019

0,010

0,004

Ha: La adherencia al curso es mayor en la modalidad PRESENCIAL.

C aptulo 6

Pgina 486

Coeficiente de incertidumbre
Al igual que el coeficiente Tau y lambda, el coeficiente de incertidumbre es
una medida de asociacin basada en la reduccin proporcional del error. Es
una medida que expresa el grado de incertidumbre que conseguimos reducir
cuando utilizamos una variable para efectuar pronsticos sobre otra.
Nominal por nominal

Valor

EE

T aprox

Significacin

Simtrica

0,014

0,008

1,762

0,003

Tipo de modalidad de curso variable


resultado

0,009

0,005

1,762

0,003

Adhesin al curso variable resultado

0,030

0,017

1,762

0,003

Ha: La adherencia al curso es mayor en la modalidad PRESENCIAL.

C aptulo 6

Pgina 487

El RENDIMIENTO acadmico (adquisicin de conocimientos)


al curso de bioestadstica depende del modelo docente
utilizado (presencial, semipresencial o online)?
Cursos semipresenciales

Presencial

Online (a distancia)

C aptulo 6

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer
Coeficiente de contingencia
Lambda
Tau de Goodman y Kruskal
Coeficiente de incertidumbre

Pgina 488

C aptulo 6

Pgina 489

El RENDIMIENTO acadmico (adquisicin de conocimientos)


al curso de bioestadstica depende del modelo docente
utilizado (presencial, semipresencial o online)?
Variable predictora TIPO DE CURSO
Variable resultado
Evaluacin de los
conocimientos

ONLINE

SEMIpresencial

PRESENCIAL

Total

Aprobados

15 (37,5%)

20 (38,4%)

60 (80%)

95

Suspensos

25

32

15

72

Total

40

52

75

167

2Pearson= 29,68

p = 0,0000004

Existe asociacin

Ha: El rendimiento del curso es dependiente del tipo de modalidad de enseanza


empleado.
El modelo PRESENCIAL se encuentra asociado a un mayor rendimiento del alumno?

C aptulo 6

Pgina 490

El modelo PRESENCIAL se encuentra asociado a un mayor


rendimiento del alumno?
Variable predictora TIPO DE CURSO
Variable resultado
Evaluacin de los
conocimientos

ONLINE

SEMIpresencial

PRESENCIAL

Total

Aprobados

15 (37,5%)

20 (38,4%)

60 (80%)

95

Suspensos

25

32

15

72

Total

40

52

75

167

C=

2
2 + n

C=

29,68
29,68 + 167

= 0,388

C > 0,30

Ha: El rendimiento del curso es mayor en la modalidad PRESENCIAL.

C aptulo 6

Nominal por nominal

Valor del estadstico

Significacin (p)

Coeficiente de contingencia C

0,388

0,000

V de Cramer

0,421

0,000

N de casos vlidos

Cmx =

167 alumnos

k-1
k

Cmx =
C ajustado =

0,388
0,816

3-1
3

= 0,816

= 0,475 (47,5%)

Ha: El rendimiento del curso es mayor en la modalidad PRESENCIAL.

Pgina 491

C aptulo 6

Pgina 492

Decisin: El coeficiente de contingencia como medida de asociacin para una escala


nominal, es una funcin de 2. La decisin de aceptar o rechazar la hiptesis se establece
mediante el valor de 2 = 29,68 con dos grados de libertad, y se obtiene una probabilidad
en su distribucin de p < 0,00001, dado que la zona de rechazo es mayor que 0,05.
Entonces se acepta Ha y se rechaza Ho; adems, el coeficiente 0,388 es distinto de
0, aunque no muy lejos de su valor mximo (0,816), ya que supone el 47,5% del valor
mximo.

Grados de libertad = [ K - 1] [F - 1] = [ 3 1] [2 1] = 2

2 = 29,68
Ho

p = 0,0000004

Ha

AZAR

5,99

C aptulo 6

Interpretacin del coeficiente de contingencia


La asociacin existente entre el RENDIMIENTO acadmico del alumno
y el tipo de curso realizado es verdadera, aumentando la frecuencia
de aprobados de manera significativa (p < 0,00001) en el modelo
PRESENCIAL, con un elevado valor de coeficiente de contingencia de
0,388 (C > 0,30).
PRESENCIAL

Pgina 493

C aptulo 6

Pgina 494

Coeficiente Lambda
Al igual que el coeficiente de incertidumbre, lambda es una medida que
expresa el grado de incertidumbre que conseguimos reducir cuando
utilizamos una variable para efectuar pronsticos sobre otra. Lambda tiene
tres versiones dos asimtricas (cuando conocemos la variable predictora y la
resultado) y una simtrica cuando no sabemos cual es la variable predictora y
cual es la variable resultado).
Nominal por nominal

Valor

EE

T aprox

Significacin

Simtrica

0,238

0,077

2,801

0,005

Tipo de modalidad de curso variable


resultado

0,185

0,067

2,527

0,012

Adhesin al curso variable resultado

0,306

0,111

2.331

0,020

Ha: El rendimiento del curso es dependiente del tipo de modalidad de enseanza


empleado.

C aptulo 6

Pgina 495

Tau de Goodman y Kruskal


Al igual que el coeficiente de incertidumbre y lambda, el coeficiente Tau (de
Goodman y Kruskal) es una medida de asociacin basada en la reduccin
proporcional del error. Es una medida que expresa el grado de incertidumbre
que conseguimos reducir cuando utilizamos una variable para efectuar
pronsticos sobre otra.
Nominal por nominal

Valor Tau

EE

Significacin

Tipo de modalidad de curso variable resultado

0,103

0,034

0,000

Rendimiento del curso variable resultado

0,178

0,057

0,000

Ha: El rendimiento del curso es dependiente del tipo de modalidad de


enseanza empleado.

C aptulo 6

Pgina 496

Coeficiente de incertidumbre
Al igual que el coeficiente Tau y lambda, el coeficiente de incertidumbre es
una medida de asociacin basada en la reduccin proporcional del error. Es
una medida que expresa el grado de incertidumbre que conseguimos reducir
cuando utilizamos una variable para efectuar pronsticos sobre otra.
Nominal por nominal

Valor

EE

T aprox

Significacin

Simtrica

0,106

0,036

2,958

0,000

Tipo de modalidad de curso variable


resultado

0,087

0,030

2,958

0,000

Adhesin al curso variable resultado

0,136

0,046

2,958

0,000

Ha: El rendimiento del curso es dependiente del tipo de modalidad de enseanza


empleado.

C aptulo 6

Pregunta de investigacin
El resultado del tratamiento depende del frmaco empleado?
La condicin de asintomtico se encuentra asociado al uso de
Mosaprida?
Variable PREDICTORA
Cualitativa policotmica
- Metoclopramida (n = 99)
- Cisaprida (n = 102)
- Mosaprida (n = 99)

Variable RESULTADO
Cualitativa policotmica
- Asintomtico
- Sntomas
- Mejora clnica

Cul es el test estadstico ms adecuado?

Pgina 497

C aptulo 6

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer
Coeficiente de contingencia
Lambda
Tau de Goodman y Kruskal
Coeficiente de incertidumbre

Pgina 498

C aptulo 6

Pgina 499

El resultado del tratamiento depende del frmaco empleado?


Variable RESULTADO Resultado del tratamiento a la
semana
Tipo de medicamento

Asintomtico

Sintomtico

Mejora

Metoclopropamida

24 (8%)

54 (18%)

21 (7%)

Cisaprida

27 (9%)

18 (6%)

57 (19%)

Mosaprida

51 (17%)

27 (9%)

21 (7%)

2Pearson= 60,12

p = 0,000

Existe asociacin

Ha: El resultado del tratamiento depende del frmaco empleado.


La condicin de asintomtico se encuentra asociada al uso de Mosaprida?

Coeficiente Lambda

C aptulo 6

Pgina 500

Coeficiente Lambda
Al igual que el coeficiente de incertidumbre, lambda es una medida que
expresa el grado de incertidumbre que conseguimos reducir cuando
utilizamos una variable para efectuar pronsticos sobre otra. Lambda tiene
tres versiones dos asimtricas (cuando conocemos la variable predictora y la
resultado) y una simtrica cuando no sabemos cual es la variable predictora y
cual es la variable resultado).
Nominal por nominal

Valor

EE

T aprox

Significacin

Simtrica

0,303

0,048

Tipo de Frmaco variable resultado

0,303

5,814

0,000

0,052

5,108

0,000

Resultado del tratamiento a la semana


variable resultado

0,303

0,054

4,899

0,000

Ha: La condicin de asintomtico se encuentra asociada al uso de Mosaprida.

C aptulo 6

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer
Coeficiente de contingencia
Lambda
Tau de Goodman y Kruskal
Coeficiente de incertidumbre

Pgina 501

C aptulo 6

Pregunta de investigacin
El resultado del tratamiento depende del frmaco empleado?
La condicin de asintomtico se encuentra asociada al uso de
Mosaprida?
Variable PREDICTORA
Cualitativa policotmica
- Metoclopramida (n = 99)
- Cisaprida (n = 102)
- Mosaprida (n = 99)

Variable RESULTADO
Cualitativa policotmica
- Asintomtico
- Sntomas
- Mejora clnica

Cul es el test estadstico ms adecuado?

Pgina 502

C aptulo 6

Pgina 503

El resultado del tratamiento depende del frmaco empleado?


Variable RESULTADO Resultado del tratamiento a la
semana
Variable PREDICTORA Asintomtico
Tipo de medicamento

Sintomtico

Mejora

Metoclopropamida

24 (8%)

54 (18%)

21 (7%)

Cisaprida

27 (9%)

18 (6%)

57 (19%)

Mosaprida

51 (17%)

27 (9%)

21 (7%)

2Pearson= 60,12

p = 0,000

Existe asociacin

Ha: El resultado del tratamiento depende del frmaco empleado.


La condicin de asintomtico se encuentra asociada al uso de Mosaprida?

Coeficiente de incertidumbre

C aptulo 6

Pgina 504

Coeficiente de incertidumbre
Al igual que el coeficiente Tau y lambda, el coeficiente de incertidumbre es
una medida de asociacin basada en la reduccin proporcional del error. Es
una medida que expresa el grado de incertidumbre que conseguimos reducir
cuando utilizamos una variable para efectuar pronsticos sobre otra.
Nominal por nominal

Valor

EE

T aprox

Significacin

Simtrica

0,086

0,023

3,801

0,000

Tipo de Frmaco variable resultado

0,086

0,023

3,801

0,000

Resultado del tratamiento a la semana


variable resultado

0,086

0,023

3,801

0,000

Ha: La condicin de asintomtico se encuentra asociada al uso de Mosaprida.

C aptulo 6

Pgina 505

Odds Ratio (OR)


Enfermedad (Variable resultado)
Exposicin (Variable predictora)

Casos

(+)

(-)

A: Personas enfermas que estn expuestas


B: Personas sanas que estn expuestas
C: Personas enfermas que no estn
expuestas
D: Personas sanas que no estn expuestas

Controles

Tasa de exposicin
Tasa de exposicin
observada
en los CASOS
observada en los CASOS

OR
de exposicin observada en
OR ==Tasa
Tasa de exposicin observada en
los CONTROLES
los CONTROLES

OR
OR ==

OR
OR ==

[ [AA/ /CC] ]
[ [BB/ /DD] ]
[ [(A
(A**D)
D)] ]
[ [(B
(B**C)
C)] ]

C aptulo 6

Pgina 506

Caractersticas de la Odds Ratio (OR)


- Medida de asociacin.
- Valores mayores de 1 (asociacin positiva) (factor de riesgo).
- Valores menores de 1 (asociacin negativa) (factor de proteccin).
- Valor = 1 (no existe asociacin).
- Estudios casos-controles.
- OR: es la razn entre la probabilidad de que un suceso ocurra y la
probabilidad de que no ocurra.
- OR : cociente entre la tasa de exposicin observada en el grupo de casos
(A/C) y la tasa de exposicin observada en el grupo control (B/D).
- OR: refleja la probabilidad de que los casos (cncer de pulmn) estn
expuestos al factor de estudio (tabaco) comparada con la probabilidad de que
lo estn los controles.

C aptulo 6

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe entre la
cloracin del agua y el cncer de vejiga?
Variable PREDICTORA
CUALITATIVA dicotmica
Cloracin del agua

Variable RESULTADO
CUALITATIVA dicotmica
Cncer de vejiga

Cul es el test estadstico ms adecuado?

Pgina 507

C aptulo 6

Pgina 508

Odds Ratio (OR)


Cncer de vejiga
Exposicin

Casos

Cloracin (+)

Controles

Cloracin (-)

D
de exposicin
TasaTasa
de CLORACIN
observada en los
enfermos
de CANCER
vejiga (casos)
observada
en losdeCASOS

A: Personas enfermas de cncer de vejiga


expuestas al cloro
B: Personas sanas expuestas al cloro
C: Personas enfermas de cncer de vejiga no
expuestas al cloro
D: Personas sanas no expuestas al cloro

OR
OR ==TasaTasadedeCLORACIN
exposicin observada
observadaen
los en
CONTROLES
SANOS (controles)

[A/C]

OR =

OR =

[B/D]
[ (A * D) ]
[ (B * C) ]

C aptulo 6

Influencia de la metodologa de la evaluacin


de la exposicin

Pgina 509

C aptulo 6

Pgina 510

Rodrguez Calabuig D, Igual Adell R, Oltra Alcaraz C, Snchez Snchez P, Bustamante Balen M, Parra
Godoy F y Nagore Enguidanos E. Actividad laboral agrcola y estrongiloidiasis. Estudio caso-control. Rev
Cln Esp 2001; 201:81-84

C aptulo 6

Pgina 511

Ejemplo de uso de la OR:


Estudio caso-control
- CASOS: Individuos con Strongiloides stercolaris en las heces ante la
presencia de eosinofilias en el hemograma.
- CONTROLES: Individuos de igual edad y sexo sin eosinofilia ni parsitos en
heces.

Rodrguez Calabuig D, Igual Adell R, Oltra Alcaraz C, Snchez Snchez P, Bustamante Balen M, Parra
Godoy F y Nagore Enguidanos E. Actividad laboral agrcola y estrongiloidiasis. Estudio caso-control. Rev
Cln Esp 2001; 201:81-84.

C aptulo 6

Odds Ratio (OR)


Ejemplo estudio caso-control

Pgina 512

C aptulo 6

Odds Ratio (OR)


Ejemplo estudio caso-control

Pgina 513

C aptulo 6

Pgina 514

Actividad laboral agrcola y estrongiloidiasis


Estudio caso-control
Discusin
Un gran nmero de personas trabajaban descalzas en la siembra, cuidando y
recolectando el arroz, con los pies hundidos en el fango durante largos perodos de tiempo,
lo que facilitara la entrada del nematodo. Los resultados obtenidos, especificando el tipo
de actividad, muestran una asociacin de la estrongiloidiasis con el cultivo de arroz OR de
2,97 (IC 95%: 1,16-7,71), lo que representa un mayor riesgo de infestacin. En la limpieza
de acequias se obtuvo tambin una tendencia casi significativa OR de 2,39 (IC 95%:
0,85-6,82), en cambio en el cultivo de ctricos y de hortalizas, que habitualmente no se
realizaban descalzos ni en tierras fangosas, no se han encontrado estas diferencias.

Rodrguez Calabuig D, Igual Adell R, Oltra Alcaraz C, Snchez Snchez P, Bustamante Balen M, Parra
Godoy F y Nagore Enguidanos E. Actividad laboral agrcola y estrongiloidiasis. Estudio caso-control. Rev
Cln Esp 2001; 201:81-84.

C aptulo 6

Pgina 515

Mito 1: La sonrisa de la esfinge


En las tablas 1 y 2 presentadas se han incluido slo el valor de la OR y su IC95%, pero
no se ha incluido el valor del estadstico (test de contraste de hiptesis) ni la significacin
estadstica p para cada variable predictora presuntamente significativa.
Cul es el valor de la p?
Por qu dices que la prctica de la limpieza de acequias est relacionada con la
estrongiloidiasis cuando el valor del IC95% de la OR incluye a la unidad?
Cul es el test de contraste de hiptesis que has empleado en cada asociacin?
Test de 2 Pearson
He calculado el valor del estadstico 2 Pearson NO hay la significacin estadstica.
Ser un error beta ?
Cul es la potencia estadstica del estudio (valor )?

C aptulo 6

Qu relacin y qu medida de asociacin existe entre la


prctica del cultivo de arroz y la estrongiloidiasis?
Test de 2 de Pearson

Variable RESULTADO
Estrongiloidiasis

Variable PREDICTORA
Cultivo de arroz

Casos

Controles

Total

Si

25 (53%)

13 (28%)

38

No

22

34

56

Total

47

47

94

2Pearson = 6,36;

p = 0,012

OR = 2,97 (1,16-7,71)
Q de Yule = 0,50

Pgina 516

C aptulo 6

Pgina 517

Resumen del procesamiento informtico de los datos


Clculos del programa estadstico tabla
2x2

Valor

Grados de
libertad

Contraste
bilateral

2Pearson

6,361

0,012

Correccin de Yates

5,345

0,021

Razn de verosimilitud

6,447

0,011

Test exacto de Fisher


N Casos vlidos

0,020

Contraste
unilateral

0,010

94

Ho (hiptesis nula) = La prctica del cultivo de arroz NO est asociada a la estrongiloidiasis


en el grupo estudiado.
Ha (hiptesis alternativa) = La prctica del cultivo de arroz est asociada a la
estrongiloidiasis en el grupo estudiado.

C aptulo 6

Test de 2 de Pearson (1 grado de libertad)

2Pearson calculado = 6,36 > 2Pearson tabulado

= 3,84

AZAR
Ha (hiptesis alternativa) = Existe relacin entre la
prctica del cultivo de arroz y la estrongiloidiasis.
2 = 6,36
Error alfa
Ha

Ho

2
AZAR

2Pearson tabulado = 3,84

Pgina 518

C aptulo 6

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe entre la
prctica del cultivo del arroz y la estrongiloidiasis?
Variable PREDICTORA
CUALITATIVA dicotmica

Variable RESULTADO
CUALITATIVA dicotmica

Cultivo de arroz

Estrongiloidiasis

OR = 2,97
IC95% = 1,16 7,71

2Pearson = 6,36;

p = 0,012

Q de Yule = 0,50

Pgina 519

C aptulo 6

Qu relacin y qu medida de asociacin existe entre la


prctica de la limpieza de acequias y la estrongiloidiasis?
Test de 2 de Pearson

Variable RESULTADO
Estrongiloidiasis

Variable PREDICTORA
Limpieza de acequia

Casos

Controles

Total

Si

17 (36%)

9 (19%)

26

No

30

38

68

Total

47

47

94

2 = 3,40 ;

p = 0,065

No existe asociacin

Pgina 520

C aptulo 6

Resumen del procesamiento informtico de los datos


Clculos del programa estadstico tabla
2x2

Valor

Grados de
libertad

Contraste
bilateral

2Pearson

3,403

0,065

Correccin de Yates

2,605

0,107

Razn de verosimilitud

3,445

Test exacto de Fisher


N Casos vlidos

Contraste
unilateral

0,063
1

0,106

94

Ho (hiptesis nula) = La limpieza de acequias NO est asociada a la


estrongiloidiasis en el grupo estudiado.
Ha (hiptesis alternativa) = La limpieza de acequias est asociada a la
estrongiloidiasis en el grupo estudiado.

0,053

Pgina 521

C aptulo 6

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe entre la
prctica de la limpieza de acequias y la estrongiloidiasis?
Variable PREDICTORA
CUALITATIVA dicotmica
Limpieza de acequias

Variable RESULTADO
CUALITATIVA dicotmica
Estrongiloidiasis

OR = 2,39

2 = 3,40 ;

IC95% = 0,85 - 6,82


p = 0,065

Q de Yule = 0,41

Pgina 522

C aptulo 6

Test de 2 de Pearson (1 grado de libertad)


2Pearson calculado = 3,40 < 2Pearson tabulado

= 3,84

AZAR
Ho (hiptesis nula) = NO existe relacin entre la prctica
de la limpieza de acequias y la estrongiloidiasis.
2 = 3,40

Grados de libertad = [ K - 1] [F - 1] = (2-1) (2 -1) = 1

Error alfa
Ha

Ho

2
AZAR

2Pearson tabulado = 3,84

Pgina 523

C aptulo 6

Pgina 524

Riesgo Relativo (RR)


Enfermedad (E)
Exposicin (F)

Casos

Tabaco (+)

Controles

Tabaco (-)

A: Personas enfermas de cncer de pulmn


fumadoras
B: Personas sanas fumadoras
C: Personas enfermas de cncer de pulmn
no fumadores
D: Personas sanas no fumadoras

[ A / (A + B)]

RR =

[ C / (C + D) ]
A<< B

A+ B B C+D D

RR =
Es la probabilidad de que una enfermedad (E) se desarrolle en el
grupo expuesto (F) en relacin a la del grupo no expuesto.

C<< D

[ (A * D) ]
[ (B * C) ]

C aptulo 6

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe entre la
exposicin al humo del tabaco durante la gestacin y el bajo
peso al nacimiento del RN?
Variable PREDICTORA
CUALITATIVA dicotmica
Exposicin al humo del
tabaco

Variable RESULTADO
CUALITATIVA dicotmica
Peso del RN

RR = 2,71 (1,38-5,34)
Q de Yule = 0,47

2Pearson= 9.03;

p = 0.00265

Martn TR, Bracken MB. Association of low birth weight with passive smoke exposure in
pregnancy. Am J. Epidemiol 1986; 124: 633-642.

Pgina 525

Pgina 526

C aptulo 6

Riesgo Relativo (RR)


Enfermedad (E)
Exposicin (F)

Casos

Tabaco (+)

A (20)

B (833)

Controles

Tabaco (-)

C (14)

D (1606)

A: RN de bajo peso de madres expuestas al


tabaco
B: RN normopeso de madres expuestas al
tabaco
C: RN de bajo paso de madres NO expuestas
al tabaco
D: RN normopeso de madres NO expuestas
al tabaco

En la Tabla, exponemos los resultados


de un estudio de seguimiento donde
853 mujeres estuvieron pasivamente
expuestas al humo del tabaco durante
la gestacin y 1620 no lo estuvieron,
y su asociacin con el bajo peso al
nacer.
2 = 9.03; p = 0.00265
95% IC (1.38;5.34)

Q de Yule = 0,47

RR =

Ie
Io

20/853
14/1620

= 2,713

El RR es 2.71, significa que las


expuestas al factor F (exposicin
pasiva al tabaco) tienen 2,71 veces
ms probabilidades de tener nios de
bajo peso que las no expuestas.

Martn TR, Bracken MB. Association of low birth weight with passive smoke exposure in pregnancy. Am J.
Epidemiol 1986; 124: 633-642.

C aptulo 6

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe entre el
sedentarismo (factor de riesgo) y el desenlace (muerte) en
pacientes que han sufrido un IAM?
Variable PREDICTORA
CUALITATIVA dicotmica
Ejercicio moderado/
Sedentarismo

Variable RESULTADO
CUALITATIVA dicotmica
Muerte / Supervivencia

100 pacientes
con IAM

Pgina 527

C aptulo 6

Pgina 528

Evolucin de 100 pacientes con IAM a los 5 aos en funcin del ejercicio fsico realizado.
Existe asociacin entre el factor de riesgo (SEDENTARISMO) y el desenlace (MUERTE)?
Cul es la magnitud de dicha asociacin?

Sedentarios
N = 40

Seguimiento
5 aos
100 pacientes
con IAM

Ejercicio
moderado
N = 60

Seguimiento
5 aos

Fallecimientos A = 15
Sobrevivientes B = 25
Fallecimientos C = 10
Sobrevivientes D = 50

C aptulo 6

Evolucin de 100 pacientes


con IAM a los 5 aos en
funcin del ejercicio fsico
Exposicin (F) Variable
predictora

Desenlace (E)
Variable resultado
Muerte

Sobreviviente

Sedentarismo (+)

A = 15

B = 25

Sedentarismo (-)

C = 10

D = 50

100 pacientes con IAM


A: Fallecidos con sedentarismo
B: Sobrevivientes sedentarios
C: Fallecidos deportistas
D: Sobrevivientes deportistas

Cul es la prueba estadstica ms adecuada?

Existe asociacin entre el factor


de riesgo (SEDENTARISMO) y el
desenlace (MUERTE)?

Pgina 529

C aptulo 6

Test de 2 de Pearson
Clculos del
programa
estadstico

Valor

Grados de libertad

Contraste bilateral

2Pearson (*)

5,56

0,018

Correccin de
Yates

4,50

0,034

Razn de
verosimilitud

5,47

Test exacto de
Fisher
N Casos vlidos

Contraste unilateral

0,019
1

0,033

0,017

100

Ha: Existe asociacin entre el factor de riesgo (SEDENTARISMO) y el desenlace


(MUERTE).

Pgina 530

C aptulo 6

Pgina 531

2 = 5,56
Error alfa
Ho

Ha
2

AZAR

2Pearson tabulado = 3,84

2Pearson
2Pearson calculado = 5,56 >2Pearson
= 43,99;
p<0,0000001
tabulado
= 3,84

Existe asociacin

p < 0,05

C aptulo 6

Evolucin de 100 pacientes


con IAM a los 5 aos en
funcin del ejercicio fsico
Exposicin (F) Variable
predictora

Pgina 532

Desenlace (E)
Variable resultado
Muerte

Sobreviviente

Sedentarismo (+)

A = 15

B = 25

Sedentarismo (-)

C = 10

D = 50

100 pacientes con IAM


A: Fallecidos con sedentarismo
B: Sobrevivientes sedentarios
C: Fallecidos deportistas
D: Sobrevivientes deportistas

Cul es la intensidad o
magnitud de dicha asociacin?

RR =

[ A / (A + B)]
[ C / (C + D) ]

Es la probabilidad de morir (E) en el grupo de sedentarios (expuestos al factor de riesgo) en relacin con la
probabilidad de muerte en deportistas (grupo no expuesto).

C aptulo 6

Riesgo Relativo (RR) =

RR =

Tasa de Incidencia de muertes en


sedentarios (en expuestos)

[ A / (A + B)]
[ C / (C + D) ]

Tasa de Incidencia de muertes


en deportistas ( NO expuestos )

RR =

[ 15 / (15 + 25)]
[ 10 / (10 + 50) ]

RR = 2,25
Q de Yule = 0,50

2Pearson= 5,56;

RR =

p = 0,018

Ie
Io

= 2,25

Pgina 533

C aptulo 6

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe entre el
ejercicio fsico moderado (factor de riesgo) y el desenlace
(muerte) en pacientes que han sufrido un IAM?
Variable PREDICTORA
CUALITATIVA dicotmica
Ejercicio moderado/
Sedentarismo

Variable RESULTADO
CUALITATIVA dicotmica
Muerte / Supervivencia

100 pacientes
con IAM

Pgina 534

C aptulo 6

Pgina 535

Evolucin de 100 pacientes con IAM a los 5 aos en funcin del ejercicio fsico realizado.
Existe asociacin entre el factor de riesgo (EJERCICIO FSICO) y el desenlace
(MUERTE)? Cul es la magnitud de dicha asociacin?

Ejercicio
moderado
N = 60

Sedentarios
N = 40

Seguimiento
5 aos
100 pacientes
con IAM
Seguimiento
5 aos

Fallecimientos C = 10
Sobrevivientes D = 50
Fallecimientos A = 15
Sobrevivientes B = 25

C aptulo 6

Evolucin de 100 pacientes


con IAM a los 5 aos en
funcin del ejercicio fsico
Exposicin (F) Variable
predictora

Pgina 536

Desenlace (E)
Variable resultado
Muerte

Sobreviviente

Ejercicio fsico (+)

A = 10

B = 50

Ejercicio fsico (-)

C = 15

D = 25

100 pacientes con IAM


A: Fallecidos con ejercicio fsico moderado
B: Sobrevivientes con ejercicio fsico
moderado
C: Fallecidos sedentarios (NO deportistas)
D: Sobrevivientes sedentario (NO deportistas)

RR =

[ A / (A + B)]
[ C / (C + D) ]

Es la probabilidad de morir (E) en el grupo de deportistas (expuestos al factor de riesgo) en relacin con la
probabilidad de muerte en sedentarios -NO deportistas- (grupo no expuesto).

C aptulo 6

Riesgo Relativo (RR) =

RR =

Tasa de Incidencia de muertes en


deportistas moderados (en expuestos)
Tasa de Incidencia de muertes
en sedentarios ( NO expuestos )

[ A / (A + B)]
[ C / (C + D) ]

RR =

[ 10 / (10 + 50)]
[ 15 / (15 + 25) ]

RR = 0,44
Q de Yule = - 0,50

2Pearson= 5,56;

RR =

p = 0,018

Ie
Io

= 0,44

Pgina 537

C aptulo 6

Pgina 538

Evolucin de 100 pacientes operados con una NUEVA tcnica quirrgica frente a 100
pacientes operados con la tcnica CLSICA.

Nueva tcnica quirrgica


Grupo problema
N= 100

Tcnica clsica
Grupo Control
N = 100

Seguimiento

Complicaciones A = 15
Sin complicaciones B = 85
Complicaciones C = 20

Seguimiento

Sin complicaciones D = 80

C aptulo 6

Riesgo Relativo (RR) =

RR =

Tasa de Incidencia de complicaciones


con la NUEVA tcnica
Tasa de Incidencia de
complicaciones con la tcnica
CLASICA

[ A / (A + B)]
[ C / (C + D) ]

RR =

RR =

[ 15 / (15 + 85)]
[ 20 / (20 + 80) ]

Ie
Io

= 0,75

RR = 0,75
RRR = [ 1 RR ] * 100

RRR = 25%

RRA = [ IN IC ] * 100

RRA = 5%

Pgina 539

C aptulo 6

Evento en estudio
Frmula
Incidencia de complicaciones
quirrgicas con la NUEVA
tcnica

I N = [ A / (A + B)]

Incidencia de complicaciones
quirrgicas con la tcnica
CLSICA

I C = [ C / (C + D) ]

RIESGO RELATIVO (RR)

[ A / (A + B)]
RR =

Reduccin del RIESGO


RELATIVO (RRR)
Reduccin ABSOLUTA del
RIESGO (RAR)
Nmero de pacientes que se
necesita operar (NNT)

Complicaciones quirrgicas
15%

20%

0,75

[ C / (C + D) ]

RRR = [ 1 RR ] * 100

RAR = [ IN IC ] * 100
NNT = [ 1 / RAR ] * 100

25%
5%
20

Pgina 540

C aptulo 6

Pgina 541

Escenario clnico: Un da muy ocupado en su centro y usted esta sentado


con la piernas en alto, hojeando un nmero reciente de Mdicos en su
tiempo libre. Se encuentra con un anuncio dePLAVIX que indica que este
medicamento produce una reduccin del riesgo de eventos cardiovasculares
en un 8% comparado con aspirina. Usted piensa si debera cambiar todos sus
pacientes a Plavix .
Eventos resultantes del anlisis del estudio CAPRIE
PLAVIX

ASPIRINA

DIFERENCIA

Pacientes

9599

9586

ICTUS

4,6%

4,8%

- 0,2%

IAM

2,9%

3,5%

- 0,6%

Otras muertes vasculares

2,4%

2,4%

0%

Total de eventos vasculares

9,8%

10,7%

- 0,9%

Como se muestra en el cuadro PLAVIX se asoci con una menor incidencia


de eventos resultantes de cualquier clase. La reduccin del Riesgo Relativo
fue de 8,7% con un IC95% = 0,3-16,5% p=0,045. Sin embargo la reduccin
del riesgo absoluto (9,8% contra 10,7%) fue de tan slo 0,9%.

C aptulo 6

Pgina 542

Aparicin de eventos cardiovasculares despus de un periodo de seguimiento en pacientes


tratados con PLAVIX (grupo problema) frente a los pacientes tratados con ASPIRINA
(grupo control).

Grupo problema
PLAVIX

Grupo control
ASPIRINA

Iplavix = 9,8

Eventos cardiovasculares A

Seguimiento

Sin eventos B

Seguimiento
Iaspirina = 10,7

Eventos cardiovasculares C
Sin eventos D

C aptulo 6

Riesgo Relativo (RR) =

RR =

IP
IA

Tasa de Incidencia de eventos


cardiovasculares con el PLAVIX
Tasa de Incidencia de eventos
cardiovasculares con ASPIRINA

9,8
10,7

= 0,916

RRR = [ 1 RR ] * 100

RR =

IP
IA

RR = 0,916
RRR = 8,7%

IC95% = 0,3-16,5% p = 0,045

RAR = [ IP IA ] * 100
NNT = [ 1 / RAR ] * 100

RAR = 0,9%
NNT = 111

pacientes

Pgina 543

C aptulo 6

Evento en estudio
Incidencia de eventos
cardiovasculares con el PLAVIX
Incidencia de eventos
cardiovasculares con la
ASPIRINA

Frmula

Complicaciones quirrgicas

I Plavix= [ A / (A + B)]

9,8%

I Aspirina = [ C / (C + D) ]

RIESGO RELATIVO (RR)

RR =
Reduccin del RIESGO
RELATIVO (RRR)

[ A / (A + B)]

0,916

[ C / (C + D) ]

RRR = [ 1 RR ] * 100

Reduccin ABSOLUTA del


RIESGO (RAR)

RAR = [ IN IC ] * 100

Nmero de pacientes que se


necesita operar (NNT)

NNT = [ 1 / RAR ] * 100

Aumento del coste mensual del


Plavix respecto a la aspirina

10,7%

Ensayo CAPRIE (Lancet)

8,7%
0,9%
111
+ 112 $ (94 )

Pgina 544

C aptulo 6

Pgina 545

Resolucin del escenario

El 8,7% de reduccin del riego que publica el artculo es la Reduccin del Riesgo
Relativo (RRR). La Reduccin Absoluta del Riesgo (RAR) fue un ridculo 0,9%, con
un NNT muy elevado (111),con un amplio IC95% (de 57 a 2500).El resultado fue
estadsticamente significativo casi marginalmente, p = 0,045, donde el IC95% de la RRR
fue del 0.3% al 16.5%, que ni siquiera apareca en el texto (slo a pie de tabla). Aunque es
estadsticamente significativo, sin embargo la significacin CLNICA es muy cuestionable.
La RRR del 8,7% de Plavix frente a aspirina se dibuja en un grfico con una rea que es
casi igual que la del 25% del RRR de la aspirina frente al placebo, violando claramente
de la ley de Tufte (factor mentiroso de Tufte = Tamao del efecto mostrado en el grfico /
Tamao del efecto en los datos 1).
La publicacin es un estudio real, el ensayo CAPRIE publicado en Lancet, y sin embargo,
despus de todo usted lgicamente decide, ahorrarles a sus pacientes y a la Seguridad
Social los 112 dlares (94) al mes que cuesta Plavix y seguir tratando a sus pacientes con
aspirina.

C aptulo 6

Pgina 546

Objetivo: Evaluar la eficacia de la disminucin de colesterol con simvastatina en la reduccin de la


mortalidad y morbilidad en pacientes con enfermedad coronaria (EC).
Diseo: Ensayo clnico controlado, aleatorizado en dos ramas, a doble ciego con placebo y un seguimiento
medio de 5,4 aos.
mbito: Pacientes procedentes de 95 centros mdicos de Escandinavia.
Sujetos de estudio: 4.444 pacientes de entre 35 y 70 aos, 81% hombres, 51% mayores de 60 aos, con
antecedentes de infarto de miocardio previo a angina de pecho, colesterol srico de 5,5 a 8,8 mmol/l,
concentraciones medias de HDL de 1,18 mmol/l, LDL 4,87 mmol/l, triglicridos 1,50 mmol/l y dieta
hipolipemiante concurrente.
Intervencin: 2.223 sujetos se les administraron 20 mgr de simvastatina y a 2.221 el correspondiente
placebo.
Parmetros principales de eficacia: Mortalidad total, mortalidad de causa coronaria, infarto de miocardio no
letal probable o definitivo verificado.
Resultados principales: Durante los 5,4 aos en promedio de seguimiento la simvastatina produjo unos
cambios medios de colesterol total, LDL colesterol y HDL colesterol de 25%, -35% y +8%,
respectivamente. 256 (12%) sujetos en el grupo de placebo murieron en comparacin con 182 (8%) en
el grupo de simvastatina. Hubo 189 muertes de origen coronario en el grupo de placebo y 111 en el de
simvastatina y 49 y 46 muertes de origen no cardiovascular en dichos grupos, respectivamente. 622 sujetos
(28%) en el grupo con placebo y 431 (19%) en el de simvastatina tuvieron uno o ms incidentes coronarios
mayores.
Conclusiones: La disminucin de la concentracin de colesterol con simvastatina reduce la mortalidad
total y la incidencia de incidentes cardiovasculares mayores.

Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the Scandivarian
Simvastatin Survival Study (4S). Lancet 1994; 334: 1383-1389.

C aptulo 6

Grupo problema
SIMVASTATINA
N = 2223
Grupo control
PLACEBO
N = 2221

ISimvastatina = 19%
Seguimiento
medio 5,4 aos

IPlacebo = 28%

Incidentes coronarios
mayores A = 431
Sin eventos B
Incidentes coronarios
mayores C = 622
Sin eventos D

Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the
Scandivarian Simvastatin Survival Study (4S). Lancet 1994; 334: 1383-1389.

Pgina 547

C aptulo 6

Muertes de origen NO
cardiovascular 46

Grupo problema
SIMVASTATINA
N = 2223
Grupo control
PLACEBO
N = 2221

ISimvastatina = 8%
Muertes de origen NO
cardiovascular 49

IPlacebo = 12%

Muertes de origen
cardiovascular A = 111
Sin eventos B
Muertes de origen
cardiovascular C = 189
Sin eventos D

Seguimiento
medio 5,4 aos

Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the
Scandivarian Simvastatin Survival Study (4S). Lancet 1994; 334: 1383-1389.

Pgina 548

Pgina 549

C aptulo 6

Simvastatina Placebo

RR

RRR

RAR

Incidentes
cardiovasculares
mayores

19%

28%

0,68

32%

9%

11

Mortalidad

8%

12%

0,66

33%

4%

25

RR =

IA

Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the
Scandivarian Simvastatin Survival Study (4S). Lancet 1994; 334: 1383-1389.

[ 1 / RAR ] * 100

Incidencia
en tratados
con
placebo
IP

[ 1 RR ] * 100

Incidencia
en tratados
con
Simvastatina
IS

IS

IS IP

NNT

C aptulo 6

Prdidas

Grupo problema
WARFARINA
N = 1103

IWarfarina = 17,8

Prdidas

Grupo control
ASPIRINA
N = 1103

IAspirina = 16,0

Pgina 550

Recurrencia de accidentes
vasculares cerebrales de origen isqumico o muerte
196
Sin eventos
Recurrencia de accidentes
vasculares cerebrales de origen isqumico o muerte
176
Sin eventos

Seguimiento 2 aos
Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

C aptulo 6

Pgina 551

C aptulo 6

Riesgo Relativo (RR) =

RR =

17,8
16,0

Tasa de Incidencia de Recurrencia de


accidentes vasculares cerebrales de origen
isqumico o muerte con WARFARINA
Tasa de Incidencia de Recurrencia de
accidentes vasculares cerebrales de
origen isqumico o muerte con ASPIRINA

RR =

IW
IA

= 1,13

RR = 1,13 ;

IC95% = 0,92 - 1,38

RRR = [ 1 RR ] * 100

p = 0,25

RRR = - 13%

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

Pgina 552

C aptulo 6

IWarfarina = 2,2
Grupo problema
WARFARINA
N = 1103

Grupo control
ASPIRINA
N = 1103

Prdidas

Seguimiento 2 aos

IAspirina = 1,5

Prdidas

Hemorragias
Intensas
44
Sin eventos
Hemorragias
Intensas
30
Sin eventos

Seguimiento 2 aos
Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

Pgina 553

C aptulo 6

Riesgo Relativo (RR) =

RR =

IP
IA

Tasa de Incidencia de HEMORRAGIAS


intensas con WARFARINA
Tasa de Incidencia de HEMORRAGIAS
intensas con ASPIRINA

RR =

2,2
1,5

= 1,48

RR = 1,48;

IC95%= 0,93-2,44

RRR = [ 1 RR ] * 100

p = 0,10

RRR = - 48%

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

Pgina 554

C aptulo 6

Aspirina

Incidencia en
tratados con
WARFARINA
IW

Incidencia
en tratados
con
ASPIRINA
IA

2,2

1,5

RR

RRR

IS IW

RRRR
= =

IA IA

1,48

[ 1 RR ] * 100

Incidencia
HEMORRAGIAS
intensas

Warfarina

- 48%

RAR
IW I A

0,7

Adems, tal como comentaban los autores en la discusin del artculo, la


warfarina tiene un coste mayor y requiere una monitorizacin ms estrecha.
Con estos datos, se puede considerar que la warfarina y la aspirina
son alternativas teraputicas razonables para prevenir los accidentes
cerebrovasculares isqumicos recurrentes?
Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al.
A comparison of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

Pgina 555

C aptulo 6

Grupo problema
WARFARINA
N = 1103

Grupo control
ASPIRINA
N = 1103

IWarfarina = 20,8

Prdidas

Seguimiento 2 aos

IAspirina = 12,9

Prdidas

Hemorragias leves
413

Sin eventos
Hemorragias leves
259

Sin eventos
Seguimiento 2 aos

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

Pgina 556

C aptulo 6

Riesgo Relativo (RR) =

RR =

IP
IA

Tasa de Incidencia de HEMORRAGIAS


leves con WARFARINA
Tasa de Incidencia de HEMORRAGIAS
leves con ASPIRINA

RR =

20,8
12,9

= 1,61

RR = 1,61;

IC95%= 1,38-1,89

RRR = [ 1 RR ] * 100

p < 0,001

RRR = - 61%

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

Pgina 557

C aptulo 6

Aspirina

Incidencia en
tratados con
WARFARINA
IW

Incidencia
en tratados
con
ASPIRINA
IA

20,8

12,9

RR

RRR

IS IW

RRRR
= =

IA IA

1,61

[ 1 RR ] * 100

Incidencia
HEMORRAGIAS leves

Warfarina

- 61%

RAR
IW I A

7,9

Adems, tal como comentaban los autores en la discusin del artculo, la


warfarina tiene un coste mayor y requiere una monitorizacin ms estrecha.
Con estos datos, se puede considerar que la warfarina y la aspirina
son alternativas teraputicas razonables para prevenir los accidentes
cerebrovasculares isqumicos recurrentes?
Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al.
A comparison of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.

Pgina 558

C aptulo 6

Pgina 559

C aptulo 6

Pgina 560

C aptulo 6

Pgina 561

C aptulo 6

Pgina 562

C aptulo 6

Pgina 563

C aptulo 6

Pgina 564

C aptulo 6

Pgina 565

C aptulo 6

Pgina 566

C aptulo 6

there were no significant differences between the warfarin and


aspirin groups in the time to the primary end point (p = 0,25 by
two-tailed logrank test; hazard ratio for warfarin as compared with
aspirin, 1.13; 95 percent confidence interval, 0.92 to 1.38; two-year
probability of an event, 17.8 percent with warfarin and 16.0
percent with aspirin) (Table 2 and Fig. 2)

Pgina 567

C aptulo 6

RESULTS (fragmento del texto)


The rates of major hemorrhage were low, with no significant
differences between treatment groups; the annual rates were
2.22 per 100 patient-years for warfarin and 1.49 per 100
patient-years for aspirin (rate ratio, 1.48; p = 0,10). Patients in
the warfarin group had significantly more minor hemorrhages
than did those in the aspirin group (Table 3). There was no
significant difference between groups in the time to the first
occurrence of major hemorrhage or the primary end point (p =
0,16; hazard ratio with warfarin as compared with aspirin, 1.15;
95 percent confidence interval, 0.95 to 1.39) (Table 2).

Pgina 568

C aptulo 6

DISCUSSION

(fragmento del texto)

We observed no significant difference between treatment


with warfarin and treatment with aspirin in the prevention of
recurrent ischemic stroke or death or in the occurrence of
serious adverse events in this large cohort of patients with
inferred noncardioembolic ischemic stroke..
Warfarin offered no additional benefit over aspirin in
preventing recurrent ischemic stroke in the population we
studied. Patients with other, established reasons for warfarin
use may take comfort in the evidence of safety and lack of
significant difference overall, as compared with aspirin.
However, aspirin, either alone or in combination with some
other antiplatelet agents, 38 appears to be a well-justified
choice for the prevention of recurrent ischemic stroke.

Pgina 569

C aptulo 6

Pgina 570

Mito 1: La sonrisa de la esfinge

Por qu concluyes que la ausencia de evidencia es evidencia de ausencia?


La ausencia de evidencia NO es evidencia de ausencia.
Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ
1995;311:485.
Altman y Bland alertaron sobre un error comn en la bibliografa biomdica:
interpretar un resultado estadsticamente no significativo, cuando se comparan
dos tratamientos, como sinnimo de su equivalencia teraputica.

C aptulo 6

Pgina 571

Mito 1: La sonrisa de la esfinge


En este estudio se comparaba la eficacia de la warfarina y de la aspirina para prevenir las
recurrencias de los accidentes vasculares cerebrales de origen isqumico. Mohr JP, et al
disearon el estudio para poder demostrar una reduccin relativa del riesgo (RRR) del 30%
en el grupo tratado con warfarina. Cuando finaliz el perodo de dos aos de seguimiento,
no se observaron diferencias estadsticamente significativas entre los dos grupos, y los
autores llegaron a la conclusin de que la warfarina y la aspirina son opciones teraputicas
razonables en este tipo de situaciones clnicas. Sin embargo, la warfarina no slo NO
consigui reducir el riesgo en un 30%, sino que lo INCREMENT en un 13%, y el riesgo
de HEMORRAGIAS importantes fue SUPERIOR en el grupo de la WARFARINA (2,22 por
100 pacientes/ao) frente a la ASPIRINA (1,49 por 100 pacientes/ao en el grupo aspirina)
pero sin alcanzar significacin. Con estos datos.
Crees que se puede considerar que la warfarina y la aspirina son alternativas teraputicas
razonables para prevenir los accidentes cerebrovasculares isqumicos recurrentes?
NO.
Adems, tal como comentaban los autores en la discusin del artculo, la warfarina tiene
un coste mayor y requiere una monitorizacin ms estrecha.

C aptulo 6

Pgina 572

C aptulo 6

El Romiplostim produjo un aumento estadsticamente significativo


del recuento de plaquetas durante el periodo de estudio, pero no
se asoci a una disminucin del las hemorragias de grado .

Pgina 573

C aptulo 6

Pgina 574

C aptulo 6

Pgina 575

C aptulo 6

Pgina 576

C aptulo 6

Pgina 577

Romiplostim. PTI
- Romiplostim. Ensayo pivotal. Fase III vs. placebo.
- Inclusin: < 30.000 plaquetas/mmc.
- Objetivo principal: > 50.000 plaquetas/mmc.

Efectos adversos:

Hemorragia Grado 3/4

Objetivo subrrogado

Romiplostim

Placebo

6 de 84 (7%)

5 de 41 (12%)

n.s.

David J Kuter, James B Bussel. Efficacy of romiplostim in patients with chronic immune thrombocytopenic
purpura: a double-blind randomised controlled trial. Lancet 2008; 371: 395403.

C aptulo 6

Pgina 578

Romiplostim. PTI
Hemorragia Grado 3/4

Romiplostim

Placebo

Total

SI

6 (7%)

5 (12%)

11

NO

78

36

114

Total

84

41

125

El Romiplostim produjo un aumento estadsticamente significativo del


recuento de plaquetas durante el periodo de estudio, pero no se asoci a
una disminucin del las hemorragias de grado .

2Pearson= 0,88;

p = 0,349

David J Kuter, James B Bussel. Efficacy of romiplostim in patients with chronic immune thrombocytopenic
purpura: a double-blind randomised controlled trial. Lancet 2008; 371: 395403.

C aptulo 6

Odds Ratio (OR) versus Riesgo Relativo (RR)


Enfermedad (E)
Exposicin (F)

Cncer de
pncreas (+)

No enfermos (-) Total

Tabaco (+)

A (10)

B (9990)

10000

Tabaco (-)

C (10)

D (19990)

20000

Total

20

29980

30000

Tasa de exposicin
observada en los CASOS

OR = [ A
/ (A + B)]
de exposicin observada en
RR = Tasa
los CONTROLES
[ C / (C + D) ]

[ 10 / (10000)]
RR =

[A/C]
OR = 2,001

OR =

[B/D]

[ 10 / (20000) ]
[ 10/10 ]

OR =

[ 9990 /19990 ]

RR = 2,000

[ (A * D) ]

La OR slo se aproxima al RR cuando el suceso es raro y ocurre en menos del 10% de los sujetos, en
OR =
estos casos ambos estimadores son intercambiables.
[ (B * C) ]

Pgina 579

C aptulo 6

Importancia del intervalo de confianza en el RR


- Risk Factors for Future Cardiovascular Events: WHS Lipoprotein(a)
Homocysteine
IL-6
Colesterol total (CT)
Colesterol-LDL (cLDL)
sICAM-1
SAA
Apo B
Cociente CT/cHDL
PCR ultrasensible
PCR + CT/cHDL

1.0

2.0

4.0

6.0

Relative Risk of Future Cardiovascular Events

Ridker PM et al. N Engl J Med 2000;342:836-843.

Pgina 580

C aptulo 6

Datos categricos:
Cualitativa versus cualitativa. Ordinales
- Test de 2 de tendencia lineal
- Tau-B de Kendall o Stuart
- Tau-C de Kendall
- Coeficiente Gamma de Goodman y Kruskal
- D de Somers
- Correlacin de Spearman
Estos estadsticos NO se pueden
utilizar cuando alguna de las variables
sea NOMINAL

Pgina 581

C aptulo 6

Pregunta de investigacin
Existe relacin entre el nivel cultural y el hbito tabquico?

Variable PREDICTORA
CUALITATIVA ordinal
Nivel cultural

Variable RESULTADO
CUALITATIVA dicotmica
Hbito tabquico

Cul es el test estadstico ms acertado?

Pgina 582

C aptulo 6

Existe relacin entre el nivel socioeconmico y el


hbito tabquico?
Tabla de contingencia que representa el nivel de estudios alcanzado frente al hbito tabquico actual
Fumador actual
ESTUDIOS

NO

SI

Total

Porcentaje

<Primarios

13

20

65%

Primarios

30

20

50

40%

Secundarios

20

10

30

33%

Universitarios

75

25

100

25%

TOTAL

132

68

200

34%

Test de 2 de tendencia lineal


2 tendencia lineal = 11,56

p=0,001

Pgina 583

C aptulo 6

Frecuencia de tabaquismo

Grfico que representa el porcentaje de fumadores


segn su nivel de instruccin

2 tendencia lineal = 11,56

p = 0,001

Pgina 584

C aptulo 6

Pregunta de investigacin
Existe relacin entre el nivel cultural y la realizacin de
alguna mamografas de cribado en los 3 ltimos aos?
Variable PREDICTORA
CUALITATIVA ordinal
Nivel educativo

Variable RESULTADO
CUALITATIVA dicotmica
Mamografa

Cul es el test estadstico ms acertado?

Pgina 585

C aptulo 6

Existe relacin entre el nivel de instruccin y la


realizacin de mamografas?
Tabla de contingencia que representa el nivel de estudios alcanzado frente a la realizacin de alguna
mamografa de cribado en los ltimos 3 aos.
Mamografa de cribado
ESTUDIOS

SI

NO

OR

Sin estudios

233

3,7%

1,00

Primarios

81

700

10,4%

3,00

1,48 - 6,06

Secundarios

23

140

14,1%

4,25

1,91 9.45

Universitarios

13

41

24,1%

8,21

3,30 20,44

TOTAL

126

1114

Test de 2 de tendencia lineal


2 tendencia lineal = 24,22

p < 0,00001

IC 95%

Pgina 586

C aptulo 6

Frecuencia de participacin en programas de prevencin


Mujeres que se han realizado alguna mamografia en los 3 ltimos aos

Grfico que representa el porcentaje de fumadores


segn su nivel de instruccin

2 tendencia lineal = 24,22

p < 0,0001

Pgina 587

C aptulo 6

Pgina 588

Resultados (fragmento del texto)


El conocimiento que las mujeres tienen de la mamografa como medida
preventiva del cncer de mama se encuentra asociado estadsticamente a
la mayor utilizacin de la misma por parte de stas y se detecta una clara
tendencia creciente en la utilizacin de la mamografa de cribado a medida
que aumenta el nivel educativo de las mujeres de la muestra.

Sim Miana J, Gaztambide Ganuza M, Morote Sanchs M, et al. Utilizacin de la mamografa de cribado
y sus determinantes demogrficos y de riesgo entre mujeres de 25 a 65 aos. Med Clin (Barc) 1997; 108:
767-771.

C aptulo 6

Pgina 589

Discusin (fragmento del texto)


Coincidente con otros datos publicados es la relacin encontrada entre el
nivel educativo y la utilizacin de la mamografa de cribado. Al igual que
ocurre con otras prcticas de carcter preventivo, la mamografa de cribado
es ms utilizada por las mujeres con mayor nivel educativo. No hay que
olvidar que este factor est relacionado con el nivel econmico, variable que
no ha sido recogida en nuestro trabajo y que tambin ha sido asociada a una
mayor utilizacin de la mamografa de cribado.

Sim Miana J, Gaztambide Ganuza M, Morote Sanchs M, et al. Utilizacin de la mamografa de cribado
y sus determinantes demogrficos y de riesgo entre mujeres de 25 a 65 aos. Med Clin (Barc) 1997; 108:
767-771.

C aptulo 6

Pregunta de investigacin
Existe relacin entre el sndrome anmico gestacional
y el grupo cultural en Ceuta? Existen diferencias en la
prevalencia durante los trimestres de la gestacin?
Variable PREDICTORA
Cualitativa dicotmica
- Cristianas
- Musulmanas

Variable RESULTADO
Cualitativa ordinal
Sndrome anmico gestacional
- Primer trimestre
- Segundo trimestre
- Tercer trimestre

Daz Portillo J et al. Prevalencia del sndrome anmico gestacional en Ceuta. Estudio de una poblacin
birracial. Ciencia Ginecolgika 1998, 2 (1): 3-14.

Pgina 590

C aptulo 6

Pgina 591

Tabla de contingencia que representa la prevalencia de sndrome anmico gestacional en los dos grupos
culturales mayoritarios de Ceuta, y su incidencia en cada trimestre del embarazo.
Mamografa de cribado
Trimestre

Cristianas

Musulmanas

Test 2

Total

1 trimestre

5,1%

11,4%

4,75

p = 0,029

7,9%

2 trimestre

23,9%

27,0%

NS

NS

25,5%

3 trimestre

39,6%

57,4%

19,91

p < 0,0001 49,2%

de tendencia lineal

34,3

56,7

71,8

Significacin (p)

p < 0,001

p < 0,001

p < 0,001

Test de 2 de tendencia lineal


Test de 2 de Pearson de indepencia

C aptulo 6

Frecuencia de Sndrome anmico gestacional

Grfico que representa la prevalencia de sndrome


anmico gestacional en los dos grupos culturales
mayoritarios de Ceuta

Pgina 592

C aptulo 6

Pregunta de investigacin
La hipertrigliceridemia en sangre de cordn umbilical
puede ser indicativa de episodios de sufrimiento fetal?
Variable PREDICTORA
SFA
Test de APGAR

Variable RESULTADO
Hipertrigliceridemia
Triglicridos (sangre de
cordn)

Pgina 593

C aptulo 6

Pgina 594

Test de 2 de tendencia lineal


Categorizacin

Variable RESULTADO
Cualitativa nominal

Variable RESULTADO
Cuantitativa continua
Variable PREDICTORA
Cuantitativa discreta

Variable
PREDICTORA
Cualitativa ordinal

Tabla 4.- Relacin entre la presencia de hipertrigliceridemia neonatal y el indice de apgar al minuto.

OR

TEST DE

Hipertrigliceridemia

Normotrigliceridemia

APGAR
Mayor de 7
Igual a 7
Menor de 7

(n=36)

(n=636)

27 (2,1%)

1253 (97,9%)

1,00

4 (11,1%)

81 (88,9%)

2,29

5 (15,6%)

27 (84,4%)

8,57

OR: Odds Ratio


Test de ji al cuadrado de tendencia (2) = 20,85 ; p<0,0001

Daz Portillo J. Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta. Tesis doctoral . Facultad de Medicina. Universidad de Cdiz . Noviembre 1997.

C aptulo 6

Pgina 595

Resultados
La tabla 4 relaciona la presencia de hipertrigliceridemia neonatal con
el ndice de Apgar al minuto. Se observ una relacin estadsticamente
significativa con tendencia lineal entre ambas variables categricas, con
una asociacin creciente entre la hipertrigliceridemia y la disminucin
del ndice de Apgar. La probabilidad de detectar hipertrigliceridemia en
neonatos con ndices de Apgar inferiores a 7 fue ocho veces superior que
en RN con Apgar fisiolgico.

C aptulo 6

Pgina 596

Discusin
Nuestros resultados apoyan los obtenidos por Tsang et al. (12) y Andersen
y Friis-Hansen (13), e indican una fuerte asociacin entre los episodios de
sufrimiento fetal y la hipertrigliceridemia neonatal.
Del mismo modo, la frecuencia de hipertrigliceridemia va aumentando
conforme disminuye el ndice de Apgar.
Exposicin
SFA

Desenlace o efecto
Hipertrigliceridemia

OR = 7,23 p=0,003
Daz Portillo J. Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta. Tesis doctoral . Facultad de Medicina. Universidad de Cdiz . Noviembre 1997.

C aptulo 6

Pgina 597

Pregunta de investigacin
La hipertrigliceridemia en sangre de cordn umbilical puede
ser debida al consumo de tabaco durante la gestacin?
Variable PREDICTORA
Consumo de tabaco

Variable RESULTADO
Hipertrigliceridemia
Triglicridos (sangre de cordn)

Jacobo Daz Portillo, Mara Jess Snchez Del Pino, Ana Navarro Arvalo. INFLUENCIA DEL
TABAQUISMO EN EL PERFIL LIPOPROTEICO Y GRADO DE PEROXIDACIN LIPDICA EN SANGRE DE
CORDN.
Revista de Diagnstico Biolgico 2000; 49: 23-30.

C aptulo 6

Test de 2 de tendencia lineal


Categorizacin

Variable RESULTADO
Cualitativa nominal

Variable RESULTADO
Cuantitativa continua
Influencia del tabaco

Hipertrigliceridemia
neonatal

Normotrigliceridemia
neonatal

OR

No fumadoras

1,7%

98,3%

1,00

Fumadoras moderadas

5,3%

94,7%

3,20

Grandes fumadoras

5,4%

94,6%

3,27

2 tendencia lineal = 5,68

p=0,017

Utiliza la estadstica como un borracho usa una farola, para aguantarse en


lugar de para iluminarse
Andrew Lang

Pgina 598

C aptulo 6

Pgina 599

Pregunta de investigacin
Existen diferencias en la prevalencia de infeccin tuberculosa
en el colectivo de inmigrantes residentes en el campamento de
Calamocarro en Ceuta segn la edad?
Variable PREDICTORA
CUALITATIVA policotmica
Inmigrantes
< 25 aos
25-35 aos
>35

Variable RESULTADO
CUALITATIVA dicotmica
Tuberculosis

Cul es el test estadstico ms adecuado?


Fernndez MT, Daz J, Snchez JM, Prez A, Vadillo J. Prevalencia de infeccin tuberculosa en la poblacin
de inmigrantes en Ceuta, Espaa. Rev Esp Salud Pblica 2001; 75: 551-8.

C aptulo 6

Pgina 600

Anlisis del texto en el MATERIAL y MTODOS


Empleamos el test de chi2 para comparacin de porcentajes, y la prueba
de la t de Student para variables cuantitativas. La evaluacin de las
tendencias se realiz con la prueba de chi2 de tendencia lineal.
Anlisis del texto en los RESULTADOS
Con independencia del punto de corte seleccionado, se observ mayor
positividad en el sexo masculino que en el femenino, y la positividad
tambin present una ligera tendencia a aumentar con la edad (p=0,07).
Anlisis del texto en la DISCUSIN
?

Fernndez MT, Daz J, Snchez JM, Prez A, Vadillo J. Prevalencia de infeccin tuberculosa en la poblacin
de inmigrantes en Ceuta, Espaa. Rev Esp Salud Pblica 2001; 75: 551-8.

C aptulo 6

Pgina 601

Test de 2 de tendencia lineal


Categorizacin

Variable RESULTADO
Cualitativa nominal policotmica

Variable RESULTADO
Cuantitativa continua
Grupo etario

Mantoux (+)

Mantoux (-)

Prevalencia

Menos de 25 aos

221

721

942

28,2%

25 - 35 aos

242

482

724

33,5%

> 35 aos

15

38

53

27,8%

2 tendencia lineal = 5,2

p = 0,07

Utiliza la estadstica como un borracho usa una farola, para aguantarse en


lugar de para iluminarse
Andrew Lang

C aptulo 6

Test de 2 de Pearson de independencia


Categorizacin

Variable RESULTADO
Cualitativa nominal dicotmica

Variable RESULTADO
Cuantitativa continua
Grupo etario

Mantoux (+)

Mantoux (-)

Prevalencia

Menos de 25 aos

221

721

942

28,2%

25 - 35 aos

242

482

777

33,1%

2 = 26,07

p=0,0000003

Utiliza la estadstica como un borracho usa una farola, para aguantarse en


lugar de para iluminarse
Andrew Lang

Pgina 602

C aptulo 6

Pgina 603

Pregunta de investigacin
Existen diferencias en la prevalencia de infeccin tuberculosa
en el colectivo de inmigrantes residentes en Toledo segn la
edad?
Variable PREDICTORA
CUALITATIVA policotmica
Inmigrantes
< 20 aos
25-29 aos
30-39 aos

Variable RESULTADO
CUALITATIVA dicotmica
Tuberculosis

Cul es el test estadstico ms adecuado?


Alonso Moreno FJ, Garca Bajo MC, Lougedo Caldern MJ, et al. Prevalencia de infeccin tuberculosa en
las personas inmigrantes del rea sur de Toledo. Rev Esp Salud Pblica 2004; 78: 593-600.

C aptulo 6

Pgina 604

Anlisis del texto en el MATERIAL y MTODOS


En el anlisis se emplearon los tests de la 2 de Pearson, para comparacin de
porcentajes, y la t de Student y anlisis de varianza (ANOVA), para comparacin de
medias y varianzas. Se realiz tambin una regresin logstica no condicional por el
mtodo stepwise backward (LR). Las variables independientes incluidas en el modelo
fueron la edad, sexo, peso y origen subsahariano, mientras que la variable dependiente fue
la IDRM positiva.
Anlisis del texto en los RESULTADOS
La prevalencia de infeccin tuberculosa por grupos de edad se muestra en la tabla 2, en
la que puede apreciarse cmo la mayor frecuencia (38,7%) apareci en el grupo de edad
30-39 aos..
Anlisis del texto en la DISCUSIN
En sta ltima la prevalencia encontrada tanto en el grupo de edad de 20 a 29 aos
(12,1%), como en el de 30 a 39 aos (22,7%), est en ambos casos por debajo de los
resultados de nuestro estudio. Los resultados de nuestro trabajo aportan valores en la
misma lnea que los obtenidos por Durn y colaboradores13 en inmigrantes recin llegados
a Barcelona.
Alonso Moreno FJ, Garca Bajo MC, Lougedo Caldern MJ, et al. Prevalencia de infeccin tuberculosa en
las personas inmigrantes del rea sur de Toledo. Rev Esp Salud Pblica 2004; 78: 593-600.

C aptulo 6

Test de 2 de tendencia lineal


Categorizacin

Variable RESULTADO
Cualitativa nominal ordinal

Variable RESULTADO
Cuantitativa continua
Prueba de la
tuberculina

Transversal

Casoscontroles

Grupo etario

Mantoux (+)

Mantoux (-)

Prevalencia

OR

Menos de 25 aos

61

64

7,8%

1,00

25 - 35 aos

21

41

62

33,9%

6,25

> 35 aos

36

57

93

38,7%

7,71

2 tendencia lineal = 17,4

p = 0,00003

Pgina 605

C aptulo 6

Pregunta de investigacin
Qu relacin existe entre la edad y la presencia de deterioro
cognitivo moderado-severo en un grupo de enfermos mayores
( aos) atendidos en los servicios de urgencia del hospital?
Variable PREDICTORA
Cualitativa ORDINAL
Grupo etario
- 60-64 aos
- 65-69 aos
- 70-74 aos
- 75-79 aos
- 80-84 aos
85 aos

Variable RESULTADO
Cualitativa dicotmica
Deterioro cognitivo

Cul es el test estadstico ms adecuado?


Laguna P, Moya M, Gazapo R, Salgado R, Calabrese S. Deteccin de deterioro cognitivo en ancianos
atendidos en un servicio de urgencias hospitalario. Rev Cln Esp 1997; 197: 336-340.

Pgina 606

C aptulo 6

Test de 2 de tendencia lineal


Categorizacin

Variable RESULTADO
Cualitativa nominal ordinal

Variable RESULTADO
Cuantitativa continua
Deterioro cognitivo

Transversal

Casos-controles

Grupo etario

SI

NO

Prevalencia

OR

60 - 64 aos

41

49

16,3%

1,00

65 - 69 aos

14

56

70

20 %

1,28

0,45 - 3,72

70 - 74 aos

19

64

83

22,9%

1,52

0,56 - 4,20

75 - 79 aos

18

51

69

26,1%

1,81

0,66 - 5,09

80 - 84 aos

18

33

51

35,3%

2,80

0,99 - 8,09

85 aos

17

13

30

56,7%

6,70

2,11 22,07

Total

94

258

352

26,7%

2 tendencia lineal = 16,3

p = 0,0005

IC95%

Pgina 607

C aptulo 6

Pgina 608

Mito 1: La sonrisa de la esfinge


Por qu estratificas la variable edad en 6 categoras?
Por qu no categorizas la variable edad en slo 3 estratos ordinales?
Aunque el clculo de la prueba Pearson de tendencia lineal ha resultado
significativa, el IC95% de los OR de los distintos grupos de edad incluyen el 1
(valor numrico de igualdad), con lo que perdemos informacin...
2

El test de de tendencia lineal, aunque admite ms de 3 categoras ordinales


para la variable predictora, no es conveniente estratificar ms all a no ser
que se disponga de un importante volumen muestral, de lo contrario los
IC95% no son significativos.
2

C aptulo 6

Test de 2 de tendencia lineal


Categorizacin

Variable RESULTADO
Cualitativa nominal ordinal

Variable RESULTADO
Cuantitativa continua
Deterioro cognitivo

Transversal

Casos-controles

Grupo etario

SI

NO

Prevalencia

OR

60 - 69 aos

22

97

119

18,5%

1,00

IC95%

70 79 aos

37

115

152

32,2%

1,42

(1,12 1,83)

80 aos

35

46

81

43,2%

3,35

(2,05 4,96)

Total

94

258

352

26,7%

El anlisis de tendencias demostr una relacin estadsticamente significativa entre la


edad del anciano y el deterioro cognitivo de grado moderado o severo (p < 0,001).

2 tendencia lineal = 13,9

p = 0,0002

Pgina 609

C aptulo 6

Pregunta de investigacin
Existe relacin entre el hbito tabquico y la presencia del
ADN del Papiloma virus (HPV) en pacientes con lesiones
escamosas intraepiteliales del crvix uterino?
Variable PREDICTORA
Cualitativa ORDINAL
Hbito tabquico
(n cigarrillos/da)
1. No fumador (0 )
2. Moderado ( 20)
3. Alto (> 20)

Variable RESULTADO
Cualitativa dicotmica
ADN del HPV
Human Papilloma Virus

Cul es el test estadstico ms acertado?


Laguna P, Moya M, Gazapo R, Salgado R, Calabrese S. Deteccin de deterioro cognitivo en ancianos
atendidos en un servicio de urgencias hospitalario. Rev Cln Esp 1997; 197: 336-340.

Pgina 610

C aptulo 6

Test de 2 de tendencia lineal


ADN HPV
TABACO

(+)

(-)

OR

No fumador

13

27,8

1,00

IC 95%

Moderado

19

24

44,2

2,06

0,55 8,62

0,36

Alto

80,0

TOTAL

28

38

10,40

0,70 550,31

0,06

2 tendencia lineal = 4,022

0,045

Tabla de contingencia que representa el hbito tabquico (n de cigarrillos al da) y la


presencia del ADN del papiloma virus (HPV) en pacientes con lesiones escamosas
intraepiteliales del crvix uterino.

Pgina 611

C aptulo 6

Pgina 612

Resultados (fragmento del texto)

No se observaron diferencias significativas entre la edad media y la edad


media de inicio de las relaciones sexuales, y la positividad del HPV. Por
el contrario, la asociacin con el hbito tabquico fue estadsticamente
significativa, observndose una asociacin creciente ente la deteccin del
HPV y el consumo de cigarrillos (tabla).

Torn A, Ordi J, Lluis M, et al. Determinacin del papiloma virus mediante hibridacin in situ. Correlacin
clnicopatolgica y virolgica en pacientes con lesiones escamosas intraepiteliales del crvix uterino. Med
Clin (Barc) 1997; 109: 691-695.

C aptulo 6

Pgina 613

Discusin (fragmento del texto)

Diversos estudios han destacado el efecto que el consumo de tabaco


puede ejercer en interaccin con el HPV facilitando y cooperando con los
mecanismos oncogenticos. En el presente estudio, el hallazgo de una
asociacin creciente entre la deteccin del HPV y el consumo de cigarrillos
puede relacionarse con el resultado de estudios experimentales que
demuestran que los productos del tabaco causan un defecto inmunolgico
a nivel cervical, disminuyendo la capacidad de presentacin de antgenos
por las clulas de langerhans, fenmeno que finalmente favorece tanto la
infeccin por HPV en el epitelio cervical.

Torn A, Ordi J, Lluis M, et al. Determinacin del papiloma virus mediante hibridacin in situ. Correlacin
clnicopatolgica y virolgica en pacientes con lesiones escamosas intraepiteliales del crvix uterino. Med
Clin (Barc) 1997; 109: 691-695.

C aptulo 6

Pgina 614

Mito 1: La sonrisa de la esfinge


Aunque el clculo de la prueba Pearson de tendencia lineal ha resultado
significativa (p= 0,045), sin embargo el IC95% de los OR de los distintos
grupos de fumadoras (moderadas e intensas) incluyen el 1 (valor numrico de
igualdad), con lo que perdemos informacin, adems se pierde significacin
estadstica (p>0,05)
2

El test de de tendencia lineal, aunque admite 3 o ms categoras ordinales


para la variable predictora, NO es conveniente que los casilleros contengan
valores inferiores a 5, como ocurre en el grupo de las fumadoras intensas (>
20 cigarrillos/da) .
2

Sabes lo que ocurre si agrupas las fumadoras moderadas con las intensas y
la enfrentas a las no fumadoras (no fumadoras versus fumadoras)?
OBSERVA LO QUE OCURRE!!!

C aptulo 6

Tabla de contingencia que representa la presencia del HPV con el hbito


tabquico.
ADN HPV
TABACO

SI (+)

NO (-)

Total

NO

13

18

SI

23

25

48

TOTAL

28

38

66

Test de 2 de Pearson de independencia


2 = 2,17

p=0,140

No existe asociacin

Pgina 615

C aptulo 6

Pgina 616

Mito 1: La sonrisa de la esfinge


Por qu torturas a los datos con test estadsticos NO idneos para que te
digan lo que a ti te interesa?
Sabes lo que te ha ocurrido?
Te ha abrumado el enorme peso de la bibliografa que es muy numerosa
en estudios experimentales y clnicos que relacionan el tabaco, el HPV y el
cncer de crvix, y su interaccin.
Ante tan bajo volumen muestral
No crees que puedes haber cometido un error beta (bajo tamao muestral)?
Sndrome de la CARGA bibliogrfica

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario INGESA de Ceuta

C aptulo 6

Pregunta de investigacin
Existe asociacin entre el hbito tabquico y la EPOC?

Variable PREDICTORA
Cualitativa dicotmica
Hbito tabquico

Variable RESULTADO
Cualitativa dicotmica
EPOC

Cul es el test estadstico ms acertado?

Pgina 617

C aptulo 6

Tabla de contingencia que representa la EPOC frente al hbito tabquico.


EPOC
TABACO

SI

NO

Total

SI

26 (43%)

34

60

NO

7 (23%)

23

30

TOTAL

33

57

90

Test de 2 de Pearson de independencia


2 = 3,44

p=0,063

No existe asociacin

Pgina 618

C aptulo 6

Pregunta de investigacin
Existe relacin entre la EPOC y el la intensidad del hbito
tabquico?
Variable PREDICTORA
Cualitativa ordinal
Hbito tabquico
1. No fumador
2. Moderado
3. Alto

Variable RESULTADO
Cualitativa dicotmica
EPOC

Cul es el test estadstico ms acertado?

Pgina 619

C aptulo 6

Tabla de contingencia que representa la EPOC frente al hbito tabquico.


EPOC
TABACO

SI

NO

Total

No fumador

23

30

Moderado

11

19

30

Alto

15

15

30

TOTAL

33

57

90

Test de 2 de Pearson de independencia


2 = 4,60

p=0,111

No existe asociacin

Pgina 620

C aptulo 6

Pgina 621

Mito 1: La sonrisa de la esfinge


Por qu utilizas el test de

Pearson

Se cumplen sus condiciones de aplicacin?


En el clculo de la prueba Pearson no se tiene en cuenta el orden de las
categoras y de este modo perdemos una valiosa informacin..
2

El test de de tendencia lineal, siempre tiene un grado de libertad, e incluye


2
una modificacin para su clculo respecto a la expresin de la prueba
, de modo se tiene en cuenta el orden de las categoras.
Pearson
2

C aptulo 6

Tabla de contingencia que representa la EPOC frente al hbito tabquico.


EPOC

Caso-control

TABACO

SI

NO

Total

OR

No fumador

23

30

1,00

Moderado

11

19

30

1,90

Alto

15

15

30

3,29

TOTAL

33

57

90

Test de 2 de tendencia lineal


2 = 4,54

p = 0,033

Existe asociacin

Pgina 622

C aptulo 6

Pregunta de investigacin
Existe relacin entre la gravedad de la EPOC y la intensidad
del hbito tabquico?
Variable PREDICTORA
Cualitativa ordinal
Hbito tabquico
1. No fumador
2. Moderado
3. Alto

Variable RESULTADO
Cualitativa ordinal
Gravedad EPOC
1. Leve
2. Moderada
3. Grave

Cul es el test estadstico ms acertado?

Pgina 623

C aptulo 6

Tabla de contingencia que representa la gravedad de la EPOC frente al hbito tabquico


EPOC
TABACO

Leve

Moderado

Grave

Total

No Fumador

20

30

Moderado

10

12

30

Alto consumo

20

30

TOTAL

30

26

34

90

Test de 2 de tendencia lineal


Coeficiente Gamma

= 0,718

Fuerte asociacin positiva entre ambas variables

Existe asociacin

Pgina 624

C aptulo 6

Pregunta de investigacin
Existe asociacin entre el nivel de instruccin (cultural) y el
nivel econmico?
A mayor nivel cultural habr mayor nivel econmico?
Variable PREDICTORA
Cualitativa ordinal
Nivel instruccin

Variable RESULTADO
Cualitativa ordinal
Nivel econmico

Cul es el test estadstico ms acertado?

Pgina 625

C aptulo 6

Existe asociacin entre el nivel de instruccin y el nivel


econmico?
Tabla de contingencia que representa el nivel de estudios frente al nivel econmico
Nivel econmico
ESTUDIOS
Alto
Medio
Bajo
TOTAL
Universitarios

19

25

Secundarios

14

22

37

Primarios

36

50

TOTAL

40

63

112

2 Pearson = 30,15

p <0,000001

SI

Existe relacin gradual entre el nivel de instruccin y el nivel econmico?

Tau-b de Kendall

Pgina 626

C aptulo 6

Existe relacin gradual entre el nivel de instruccin y el nivel


econmico?
Ho: A mayor nivel de instruccin no existe mayor nivel econmico.
Ha: A mayor nivel de instruccin mayor nivel econmico.

Tau-b de Kendall
Ordinal por ordinal

Valor del estadstico

Significacin

Tau-b de Kendall

+ 0,448

0,000

Tau-c de Kendall

+ 0,399

0,000

Ha: A mayor nivel de instruccin mayor nivel econmico.

SI

Pgina 627

C aptulo 6

Tau-b de Kendall
- Condiciones de aplicacin.
- Tablas cuadradas (3 x 3), (4 x 4)
- Interpretacin:
Estadistico
Tipo Variables
- Tau = 0 independencia.
- Tau > 0 asociacin positiva.
Tau-b de Kendall
Ordinal X Ordinal
- Tau < 0 asociacin negativa.
Tau-c de Kendall
Ordinal X Ordinal
- Intervalo de Tau : (-1, +1).
- Informacin:
- Medida de la intensidad de la asociacin de variables ordinales.
- Sentido de la misma (direccionalidad).

Tipo tabla
K=F
KF

Tau-b de Kendall
- Condiciones de aplicacin: nmero de filas distinto al nmero de columnas (Tablas NO
cuadradas).

Pgina 628

C aptulo 6

Pregunta de investigacin
Existe asociacin entre el nivel de instruccin (cultural) y el
nivel econmico?
A mayor nivel cultural habr mayor nivel econmico?
Variable PREDICTORA
Cualitativa ordinal
Nivel instruccin

Variable RESULTADO
Cualitativa ordinal
Nivel econmico

Cul es el test estadstico ms acertado?

Pgina 629

C aptulo 6

Existe asociacin entre el nivel de instruccin y el nivel


econmico?
Tabla de contingencia que representa el nivel de estudios frente al nivel econmico
Nivel econmico
ESTUDIOS
Alto
Medio
Bajo
TOTAL
Universitarios

19

25

Secundarios

14

22

37

Primarios

36

50

TOTAL

40

63

112

2 Pearson = 30,15

p <0,000001

SI

Existe relacin gradual entre el nivel de instruccin y el nivel econmico?

Coeficiente Gamma

Pgina 630

C aptulo 6

Existe relacin gradual entre el nivel de instruccin y el nivel


econmico?
Ho: A mayor nivel de instruccin no existe mayor nivel econmico.
Ha: A mayor nivel de instruccin mayor nivel econmico.

Coeficiente Gamma
Ordinal por ordinal

Valor de

EE

T aprox

Significacin

Gamma

+ 0,687

0,098

5,804

0,000

N de casos vlidos

112

Ha: A mayor nivel de instruccin mayor nivel econmico.

SI

Pgina 631

C aptulo 6

Coeficiente Gamma
- Test de contraste de hiptesis.
- Test de asociacin para variables ordinales.
- Interpretacin:
=0
independencia
>0
asociacin positiva
<0
asociacin negativa
- Intervalo de : (-1, +1).
- Informacin:
- Medida de la intensidad de la asociacin de variables ordinales.
- Sentido de la misma (direccionalidad).
A mayor nivel de
instruccin MENOR
nivel econmico

-1

Variables no
asociadas

A mayor nivel de
instruccin MAYOR
nivel econmico

+1

Pgina 632

C aptulo 6

Pregunta de investigacin
Existe asociacin entre el nivel de instruccin (cultural) y el
nivel econmico?
A mayor nivel cultural habr mayor nivel econmico?
Variable PREDICTORA
Cualitativa ordinal
Nivel instruccin

Variable RESULTADO
Cualitativa ordinal
Nivel econmico

Cul es el test estadstico ms acertado?

Pgina 633

C aptulo 6

Existe asociacin entre el nivel de instruccin y el nivel


econmico?
Tabla de contingencia que representa el nivel de estudios frente al nivel econmico
Nivel econmico
ESTUDIOS
Alto
Medio
Bajo
TOTAL
Universitarios

19

25

Secundarios

14

22

37

Primarios

36

50

TOTAL

40

63

112

2 Pearson = 30,15

p <0,000001

SI

Ha: El nivel econmico (variable resultado) es dependiente del nivel de


instruccin (variable predictora).
Existe relacin gradual entre el nivel de instruccin y el nivel econmico?

D de Somers

Pgina 634

C aptulo 6

Existe relacin gradual entre el nivel de instruccin y el nivel


econmico?
Ho: A mayor nivel de instruccin no existe mayor nivel econmico.
Ha: A mayor nivel de instruccin mayor nivel econmico.

D de Somers
Valor del estadstico D

Significacin

0,447

0,000

Nivel de instruccin resultado (dependiente) 0,484

0,000

Nivel econmico resultado (dependiente)

0,000

Simtrica (no se sabe cual es la resultado)

0,415

Ha: A mayor nivel de instruccin mayor nivel econmico.

SI

Pgina 635

C aptulo 6

D de Somers
- Test de contraste de hiptesis.
- Test de asociacin para variables ordinales.
- Interpretacin:
D =0
independencia
D >0
asociacin positiva
D <0
asociacin negativa
- Intervalo de D de Somers: (-1, +1).
- Informacin:
- Medida de la intensidad de la asociacin de variables ordinales.
- Sentido de la misma (direccionalidad).
A mayor nivel de
instruccin MENOR
nivel econmico

-1

Variables no
asociadas

A mayor nivel de
instruccin MAYOR
nivel econmico

+1

Pgina 636

C aptulo 6

Pregunta de investigacin
Existe asociacin entre el nivel de instruccin (cultural) y el
nivel econmico?
A mayor nivel cultural habr mayor nivel econmico?
Variable PREDICTORA
Cualitativa ordinal
Nivel instruccin

Variable RESULTADO
Cualitativa ordinal
Nivel econmico

RESUMEN

Cul es los tests estadsticos ms acertados?

Pgina 637

C aptulo 6

Nivel econmico
ESTUDIOS

Alto

Medio

Bajo

Muy bajo

TOTAL

Titulado superior

12

32

50

Titulado medio

21

136

19

181

Secundarios

94

95

190

Primarios

24

29

53

TOTAL

17

54

260

143

474

Existe relacin gradual entre el nivel de instruccin y el nivel econmico?

D de Somers
Tau-b de Kendall

Gamma

Tau-c de Kendall

Pgina 638

C aptulo 6

D de Sommers (medidas
direccionales)

Valor del
estadstico

EED

T aprox

Muy bajo

Simtrica (no se sabe cual es la 0,557


variable resultado)

0,029

16,075

0,000

Nivel econmico variable


resultado (dependiente)

0,525

0,030

16,075

0,000

Nivel de instruccin variable


resultado (dependiente)

0,593

0,030

16,075

0,000

Ordinal por ordinal

Valor del estadstico

EE

T aprox

Significacin

Gamma

0,798

0,031

16,075

0,000

Tau-b de Kendall

0,558

0,029

16,075

0,000

Tau-c de Kendall

0,469

0,029

16,075

0,000

N de casos vlidos

474

Ha: A mayor nivel de instruccin mayor nivel econmico.

Pgina 639

C aptulo 7

Captulo 7
Publicacin Bioestadstica: Anlisis bivariante.
Test de contraste de hiptesis.
Cuantitativa versus cuantitativa.

Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Pgina 640

C aptulo 7

Pgina 641

Materiales y mtodos
Estructura
1. Tipo de diseo (estudio).
2. Sujetos incluidos (criterios de seleccin de la muestra)
3. Fuentes de informacin.
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales).
5. Instrumentos y procedimientos de medida (cuestionarios).
6. Definicin de las variables y covariables incluidas en el estudio (factor de
estudio y criterio de evaluacin).
7. Limitaciones y consideraciones ticas de la investigacin.
8. Pruebas estadsticas a utilizar (programa estadstico).

C aptulo 7

Fases del anlisis estadstico


1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE

Pgina 642

C aptulo 7

Decisiones que se pueden tomar en un test de contraste


de hiptesis despus de conocer el valor de significacin
estadstica p
p < 0,05

AB

p 0,10

A=B

Se rechaza la hiptesis nula

No se puede rechazar la hiptesis nula

No parece que el azar pueda


explicarlo todo

No se puede descartar que el azar lo


explique todo

El EFECTO observado es mayor que


el ERROR

El EFECTO observado es similar que el


ERROR

Hay diferencias estadsticamente


significativas

NO hay diferencias estadsticamente


significativas

Existen evidencias a favor de la


hiptesis alternativa Ha, y por tanto
rechazamos la hiptesis nula Ho

NO existen evidencias a favor de la


hiptesis alternativa Ha, y por tanto
aceptamos la hiptesis nula Ho

Los lmites de 0,05 y 0,1 pueden ser considerados en cierto modo


arbitrarios y aproximados

Pgina 643

C aptulo 7

Anlisis estadstico
Tipos de test analticos estadsticos de contraste de hiptesis
segn el tipo de variables implicadas en el estudio
Variable dependiente
Variable resultado
Variable
Predictora
Variable
Independiente

Dicotmica

Continua

Dicotmica

Test de 2

t de Student

Continua

Regresin logstica

Regresin lineal

Pgina 644

C aptulo 7

Anlisis estadstico

ANLISIS ESTADSTICO
Variable
Predictora
Variable
Independiente

Variable resultado
Dicotmica

Continua

Dicotmica

Test de 2

t de Student

Continua

Regresin logstica

Regresin lineal

REGRESIN LINEAL SIMPLE

Pgina 645

C aptulo 7

Pgina 646

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable
Independiente o
PREDICTORA

Variable
Dependiente o
RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de Fisher
Test de McNemar
Q de Cochran
REGRESIN LOGSTICA

Si el tamao muestral es grande


Si el tamao muestral es pequeo
Dos grupos de muestras repetidas o apareadas
Ms de dos grupos de muestras repetidas o apareadas
Varias variables predictoras cualitativas

Cualitativa

Cuantitativa

t de Student
Anlisis de la Varianza
Test de Mann-Whitney
Test de Wilcoxon
Test de Kruskall-Wallis
Test de Friedman

Compara medias entre dos grupos independientes


Compara medias entre ms de dos grupos independientes
Dos grupos independientes No paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, medidas repetidas
Ms de dos grupos No paramtrico medidas repetidas

Cuantitativa

Cualitativa

Regresin logstica simple


Regresin logstica multivariante

Una sola variable predictora cuantitativa


Varias variable predictoras cuantitativa o cualitativas

Cuantitativa

Cuantitativa

Regresin lineal simple


Correlacin de Pearson
Correlacin de Sperman
REGRESIN MLTIPLE

Paramtrico
Paramtrico
No paramtrico
Varias variables predictoras cuantitativas

Cualitativa

Superviviencia

Kaplan-Meier
Long-Rank
Regresin de COX

Curvas de superviviencia
Compara curvas de superviviencia
Anlisis Multivariante

C aptulo 7

Pgina 647

Tipos de test analticos estadsticos bivariantes de contraste


de hiptesis ms frecuentes
Variable
PREDICTORA o
Independiente (factor
de estudio)

Variable RESULTADO o Dependiente (Criterio de evaluacin)


Cualitativa nominal
dos
categoras

Cualitativa nominal
>2
categoras

Cualitativa ordinal o
Cuantitativa NO
paramtrica

Cuantitativa
paramtrica

Cualitativa dos grupos


independientes

Chi cuadrado
Z comparacin de
proporciones
Test exacto de
Fisher

Chi cuadrado

U de Mann-Whitney

T de Student
(prueba de Welch)

Cualitativa dos grupos


apareados

Test de McNemar

Q de Cochran

Prueba de los
rangos
de Wilcoxon

T de Student
para datos
emparejados

Cualitativa > 2 grupos


independientes

Chi cuadrado

Chi cuadrado

Prueba de KruskalWallis

Anlisis de la Varianza
(ANOVA)

Cualitativa > 2 grupos


apareados

Q de Cochran

Q de Cochran

Prueba de Friedman

Anlisis de la Varianza
de dos vas

Cuantitativa

Regresin logstica

Regresin logstica

Correlacin de
Sperman
Tau de Kendall

Regresin lineal
Correlacin de Pearson

C aptulo 7

Cualitativa versus cuantitativa


Cules son las pruebas estadsticas que tenemos que emplear?

Variable PREDICTORA
CUANTITATIVA
- Continua
- Discreta

Variable RESULTADO
CUANTITATIVA
- Continua
- Discreta

Pgina 648

C aptulo 7

Pgina 649

Datos cuantitativos:
Cuantitativa versus cuantitativa
Regresin lineal simple:
- Describe como es la relacin entre la variable predictora (X) y la variable
resultado (Y)
- Busca la lnea que mejor se ajusta a los puntos (x, y), y por tanto busca la
mejor prediccin de Y a partir de X
Correlacin:
- Mide el grado o fuerza de asociacin entre dos variables cuantitativas (X, Y).

C aptulo 7

Datos cuantitativos:
Cuantitativa versus cuantitativa
Regresin lineal simple.
- Coeficiente de regresin
- Covarianza
Correlacin paramtrica
- Coeficiente de correlacin de Pearson (r)
- Coeficiente de determinacin r2
Correlacin NO paramtrica
- Coeficiente de correlacin de Spearman ()
Concordancia
- Coeficiente de correlacin intraclase

Pgina 650

C aptulo 7

Datos cuantitativos:
Cuantitativa versus cuantitativa
Comparacin de mtodos analticos
Regresin paramtrica
- Regresin lineal simple
- Coeficiente de regresin
- Coeficiente de correlacin intraclase
Regresiones NO paramtricas
- Regresin de Theil
- Regresin de Passing - Bablok
- Regresin de Bland - Altman
- Regresin de Tholen - Ludbrook

Pgina 651

Pgina 652

C aptulo 7

Relacin directa e inversa


100

330
280

Incorrelacin

90
80

230

80

Fuerte relacin
directa.

60
50

70

180

40

60

130

30

50

20

80

40

10

30
140

30
150

160

170

180

190

Para valores de X por encima de la media tenemos


valores de Y por encima y
por debajo en proporciones
similares. Incorrelacin.

200

Cierta relacin
inversa

70

140

150

160

170

180

190

200

Para los valores de X mayores


que la media le corresponden
valores de Y mayores tambin.
Para los valores de X menores
que la media le corresponden
valores de Y menores tambin.
Esto se llama relacin directa.

140

150

160

170

180

190

200

Para los valores de X mayores


que la media le corresponden
valores de Y menores. Esto es
relacin inversa o decreciente.

C aptulo 7

Pregunta de investigacin
Qu relacin existe entre el grado de IRC y el grado de
anemizacin del enfermo?
Variable PREDICTORA (X)
Cuantitativa continua
IRC

Creatinemia

Variable RESULTADO (Y)


Cuantitativa continua
Anemia

Hemoglobinemia

Pgina 653

C aptulo 7

Relacin entre variables cuantitativas continuas


Variable RESULTADO-RESPUESTA-posible EFECTO
Variable dependiente
Variable cuantitativa continua

Hemoglobina (g/dl)
11

10

7
2

8 Creatinina (mg/dl)

Representacin grfica de los niveles de creatinina y hemoglobina en


50 pacientes con fallo renal crnico
Variable PREDICTORA-EXPOSICIN-posible CAUSA
Variable independiente, fija controlada por el investigador
Variable cuantitativa continua

Pgina 654

C aptulo 7

Regresin lineal simple. Coeficiente de regresin


0

Hemoglobina (g/dl)

Estimaciones de los parmetros y sus


errores estndar para en la relacin de los
niveles de creatinina y hemoglobina en 50
pacientes con fallo renal crnico
Variable

Representacin grfica de los niveles de creatinina y


hemoglobina en 50 pacientes con fallo renal crnico

Coeficiente de regresin 1
Hb (Y) = 12,25 0,5708 * [Creatinina]

Estimacin Error estndar

Constante 12,25

0,2984

Creatinina - 0,5708

0,05312

E(Y) = 0 + 1 * X

Pgina 655

C aptulo 7

Pgina 656

Regresin Lineal Simple. Coeficiente de regresin


El valor de 1 es estadsticamente distinto de cero y por tanto podemos decir que existe
dependencia lineal entre los niveles de Hb y los de Cr en los pacientes con IRC?
Z

Valor

Error

Z90%
Z99%

1,64

90%

10%

Z95%

1,96

95%

5%

2,56

99%

1%

Z99,5%

3,29

99,5%

0,5%

1
EE1

0,5708
0,05312

Estimaciones de los parmetros y sus


errores estndar para en la relacin de los
niveles de creatinina y hemoglobina en 50
pacientes con fallo renal crnico
Variable

Estimacin Error estndar

Constante 12,25

0,2984

Creatinina - 0,5708

0,05312

10,74 > Z95%

Podemos decir con error inferior al 5% que el nivel de Hb est asociado o depende del
nivel de Cr.

C aptulo 7

Pgina 657

Clculo del Intervalo de Confianza (IC) del coeficiente de


regresin
Cul es el IC al 95% de confianza para el cambio en el nivel de Hb por unidad de
aumento en el nivel de Cr en los pacientes con IRC?
Z

Valor

Z95%

1,96

95%

2,56

99%

Z99,5%

3,29

99,5%

Z99%

Z95%

EE1

- 0,5708 (1,96) X 0,05312 = (- 0,67, -0,47)


Podemos decir con error inferior al 5% , es decir con una confianza del 95%, que el
descenso medio del nivel de Hb ser como mnimo 0,47 g/dl y como mximo 0,67 g/dl por
aumento en 1 mg/dl en el nivel de Cr. El hecho de que el IC95% no contenga al cero esta
de acuerdo con el resultado del contraste de hiptesis realizado (p<0,05).

C aptulo 7

Pgina 658

Covarianza de dos variables X e Y

- La covarianza entre dos variables, Sxy, nos indica si la posible relacin entre
dos variables es directa o inversa.
Directa: Sxy >0
1
S
=
( xi - x )( yi - y )
Inversa: Sxy <0
xy
n
i
Incorreladas: Sxy =0

- El signo de la covarianza nos dice si el aspecto de la nube de puntos es


creciente o no, pero no nos dice nada sobre el grado de relacin entre las
variables.

C aptulo 7

Regresin lineal simple: Covarianza


n

Covarianza negativa < 0

Covarianza positiva > 0

sxy =

Valores de la COVARIANZA dependiendo de la variacin al unsono de x e y

( X
i =1

100

rxy =
90

( X
i =1

- X )(Yi - Y )

- X )(Yi - Y )

n sx s y

80

70

rxy =

Covarianza nula = 0

60
10

20

30

40

50

El valor de la COVARIANZA es cero cuando no hay variacin al unsono de x e y

sxy
sx s y

Pgina 659

C aptulo 7

Covarianza y coeficiente de correlacin de Pearson (r)


n

rxy =

( X
i =1

rxy =

- X )(Yi - Y )

n sx s y

sxy
sx s y

Pgina 660

C aptulo 7

Coeficiente de correlacin lineal de Pearson

r=

Pgina 661

S xy
SxS y

- La coeficiente de correlacin lineal de Pearson de dos variables, r, nos indica si los


puntos tienen una tendencia a disponerse alineadamente.
- El coeficiente tiene el mismo signo que la covarianza Sxy por tanto su signo nos informa
del tipo de relacin, directa o inversa.
r es til para determinar si hay relacin lineal entre dos variables, pero no servir para otro
tipo de relaciones (cuadrtica, logartmica, ...)
- El coeficiente de correlacin no se debe extrapolar ms all del rango de valores
observado de las variables en estudio ya que la relacin existente entre X e Y puede
cambiar fuera de dicho rango.
- La correlacin no implica causalidad. La causalidad es un juicio de valor que requiere
ms informacin que un simple valor cuantitativo de un coeficiente de correlacin (*).
- No debe utilizarse para comparar dos mtodos que intentan medir el mismo evento
(variable), como por ejemplo dos instrumentos que miden la tensin arterial. El coeficiente
r mide el grado de asociacin entre dos cantidades pero no mira el nivel de acuerdo
o concordancia. Si los instrumentos de medida miden sistemticamente cantidades
diferentes uno del otro, la correlacin puede ser r 1 y su concordancia ser nula (**).
(*) Pita Fernndez S. Correlacin frente a causalidad JANO 1996; (1174): 59-60.
(**) Bland JM, Altman DG. Statistical methods for assesing agreement between two methods of clinical
measurement. Lancet 1986; 1: 307-310.

C aptulo 7

Pgina 662

Propiedades de r
- Es adimensional
- Slo toma valores en [-1,1]
- Las variables son incorreladas
r=0
- Relacin lineal perfecta entre dos variables
r=+1 o r=-1
- Excluimos los casos de puntos alineados horizontal o verticalmente.
- Cuanto ms cerca est r de +1 o -1 mejor ser el grado de relacin lineal.
- Siempre que no existan observaciones anmalas.

Relacin
inversa
perfecta

Variables
incorreladas

Relacin
directa casi
perfecta

-1

+1

Horbar JD, Onstad L, Wright E. Predicting mortality risk for infants weighing 501 to 1500 grams at birth: The
National Institutes of Health Neonatal Research Network report. Crit Care Med 1993; 21:1218.

Pgina 663

C aptulo 7

Hb (Y) = 12,25 0,5708 * [Creatinina]


12

1 = - 0,5708

Hb (Y) = 12,25 0,5708 * [Creatinina]

1 = - 0,5708

12

10

10

10

10

Nube de puntos con distinta fuerza de asociacin pero con la misma regresin 1

C aptulo 7

Coeficiente de correlacin de Pearson


Y
12

1 =1-= 0,5708
- 0,5708

1 = - 0,5708

12

10

10

r = - 0,72
0,98
2

10

Alta fuerza de asociacin


Alto valor de r

r = - 0,72
2

10

Menor fuerza de asociacin


Menor valor de r

Pgina 664

C aptulo 7

Pgina 665

Coeficiente de correlacin de Pearson


Y
12

- El valor absoluto de r es una medida de la fuerza de


asociacin entre dos variables cuantitativas distintas.

r > 0,70: magnitud intensa

0,3 < r < 0,7: magnitud moderada

r < 0,3: magnitud dbil
- Valores: -1 y 1
- Clculo del tamao muestral
- Mide la asociacin pero NO confundir la asociacin
estadstica con una relacin CAUSA-EFECTO.

10

r = - 0,72
2

10

Valor de r indica FUERZA de asociacin

C aptulo 7

Coeficiente de correlacin de Pearson


r =r 0,136;
p = 0,042
= -0,136;
p = 0,048

Edad

Indice de Quetelet (IMC)

r = 0,178;
p = 0,042
r = - 0,178

Excrecin de sodio (mEq) en orina de 24 horas

Bajo valor de r

Baja fuerza de asociacin

Pgina 666

C aptulo 7

Pgina 667

Ejemplo del clculo del tamao muestral para el clculo del


coeficiente de correlacin entre dos variables cuantitativas
Supongamos que se desea estudiar la asociacin entre la edad y el nivel de colesterol
entre los pacientes de un centro de salud. Se disea un estudio piloto en el que se
determinar mediante una analtica el colesterol en una muestra aleatoria de los pacientes
durante un periodo de tiempo prefijado, de los que tambin se registrar su edad. Se
obtiene un valor del coeficiente de correlacin lineal de Pearson entre la edad y el
colesterol de r=0,3. Aplicando las frmulas, con un NIVEL DE CONFIANZA del 95% (error
=5%) y un PODER ESTADSTICO del 80% (error =20%), se obtiene:
En este caso, se necesitara incluir a 85
pacientes para llevar a cabo el estudio.

Si, adems, en este ltimo caso se prev un 20% de posibles prdidas de informacin
durante la ejecucin del estudio, el tamao muestral se recalcular segn la expresin:
Es decir, se necesitara una muestra
de 107 pacientes para llevar a cabo la
investigacin.
Prtegas Daz S, Pita Fernndez S. Determinacin del tamao muestral para calcular la significacin del
coeficiente de correlacin lineal. Cad Aten Primaria 2001; 9: 209-211.

C aptulo 7

Regresin lineal simple. Coeficiente de determinacin


Variable RESULTADO-RESPUESTA-posible EFECTO
Variable dependiente
Variable cuantitativa continua

Hemoglobina (g/dl)

0 11

r = - 0,84

10

r2 = 0,71

Y = 12,25 0,5708 * X
7
2

8 Creatinina (mg/dl)

Representacin grfica de los niveles de creatinina y hemoglobina en


50 pacientes con fallo renal crnico
Variable PREDICTORA-EXPOSICIN-posible CAUSA
Variable independiente, fija controlada por el investigador
Variable cuantitativa continua

Pgina 668

C aptulo 7

Coeficiente de determinacin r2
- Indica el porcentaje de la variabilidad total de la variable dependiente o resultado
(Y) que puede ser explicada por la variable independiente o predictora (X)

- Se puede afirmar que el 71% de la variabilidad de las Hb (variable resultado) de


los 50 pacientes con IRC puede ser explicada por la distinta Cr de ellos ( r 2 =
0,71 ), resta por explicar un 29% que es achacable a otras variables predictoras
distintas de la Cr.

- Valores: -1 y 1

- El coeficiente de correlacin r de Pearson deca que la magnitud de la


asociacin entre la Hb y la Cr es del 84% (r=0,84) de la mxima posible.

Pgina 669

Pgina 670

C aptulo 7

Tipos de correlaciones: positivas (r > 0)


330
280
230
180
130

r=0,1

80
30
140

150

160

170

180

190

200

130
120
110
100
90
80
70
60
50
40
30
140

100

100

90

90

80

80

70

70

60

60

50

50

r=0,8

40
30
140

150

160

170

180

190

r=0,4
150

160

170

180

200

200

r=0,99

40
30
140

190

150

1 = constante (+)

160

170

180

190

200

Pgina 671

C aptulo 7

Tipos de correlaciones: negativas (r < 0)


90

80

80

70

70
60
50
40
30
20
10
0

60
50
40
30
20

r=-0,5
140

150

160

170

180

190

200

0
140

80

80

70

70

60

60

50

50

40

40

30

30

20
10
0
140

20

r=-0,95
150

r=-0,7

10

10
160

170

180

190

200

150

160

170

180

190

200

160

170

180

190

200

r=-0,999

0
140

150

1 = constante (-)

C aptulo 7

Fenmeno Tracking

FACTORES AMBIENTALES

PERFIL LIPDICO
NEONATO

Estudio de cohortes
de 108 nios

PERFIL LIPDICO
SEGUNDO AO

FACTORES GENTICOS

Daz Portillo J. Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta. Tesis doctoral (Noviembre 1997). Facultad de Medicina de la Universidad de Cdiz.

Pgina 672

C aptulo 7

Colesterol total (mg/dl) al nacimiento

110

r = 0,23
r2 = 0,05
p < 0,05

80

50

20
80

130

180

Colesterol total (mg/dl) durante el segundo ao de vida

230

Pgina 673

C aptulo 7

Colesterol total (mg/dl) al nacimiento

110

21/108 (19,4%)
14/61 Cristianos (23,0%)
6/44 Musulmanes (13,6%)

8/108 (7,4%)
4/61 Cristianos (6,5%)
4/44 Musulmanes (9,1%)

80
P75

50

c
64/108 (59,5%)
34/61 Cristianos (55,7%)
28/44 Musulmanes (63,6%)

20
80

130

14/108 (13,9%)
9/61 Cristianos (14,7%)
6/44 Musulmanes (13,6%)
180
P75

Colesterol total (mg/dl) durante el segundo ao de vida

230

Pgina 674

C aptulo 7

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar

DESPUS del curso

NEONATOS
CT > P75

CT P75

CT P75

2McMemar

CT > P75

Z McNemar =

[ ( B C ) 1 ]2

B+C
(B C)1

B+C

Pgina 675

C aptulo 7

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar
NEONATOS
CT > P75
CT P75

McMemar =

DESPUS del curso


CT > P75

CT P75

14

64

[ ( 21 14 ) 1 ]2

21 + 14

21

= 1,03

Pgina 676

C aptulo 7

Valor

Z95%

1,96

0,05

Z98%

2,32

0,02

Z99%

2,56

0,01

Z99,5%

3,29

0,005

Z McNemar =

Z McNemar =

Pgina 677

(B C)1

B+C
( 21 14 ) 1

21 + 14

= 1,014

Conclusin: Como el estadstico Z calculado 1,014 es INFERIOR a Z tabulado


para un error alfa de 0,05 (1,96), podemos decir que las dos variables
evaluadas son independientes, es decir NO estn correlacionadas, y por tanto
no hay cambios importantes en la distribucin del colesterol total al pasar del
nacimiento al segundo ao de vida. Este comportamiento tambin se repite
en los dos grupos culturales (cristianos y musulmanes) de Ceuta.

C aptulo 7

Colesterol total (mg/dl) al nacimiento

110

80
P75

50

c
D

20
80

130

180
P75

Colesterol total (mg/dl) durante el segundo ao de vida

230

Pgina 678

C aptulo 7

r = 0,37
r2 = 0,14
p < 0,01

Apoprotena B (mg/dl) al nacimiento

50

40

30
20

10

0
30

40

50

60

70

80

90

100

110

120

130

Apoprotena B (mg/dl) durante el segundo ao de vida (12-20 meses)

Pgina 679

C aptulo 7

Apoprotena B (mg/dl) al nacimiento

42

34

26

r = 0,29 (IC95%=0,03-0,50)
r2 = 0,08
p < 0,05

18

10
30

70

110

150

Apoprotena B (mg/dl) durante los primeros meses (12-13) del segundo ao de vida

Pgina 680

C aptulo 7

Apoprotena B (mg/dl) al nacimiento

47
39

r = 0,50 (IC95%=0,25-0,68)
r2 = 0,25
p < 0,001

31

23
15

7
40

60

80

100

120

Apoprotena B (mg/dl) durante los 14-20 meses del segundo ao de vida

Pgina 681

C aptulo 7

Pgina 682

Limitaciones del coeficiente de correlacin de Pearson


Representacin grfica de la actividad de protrombina (INR) y la albmina srica en pacientes con hepatocarcinoma.

PROTROMBINA
Variable RESULTADO-RESPUESTA
Variable dependiente
Variable cuantitativa continua

120

Protrombina (INR) = 25,1 + (14,4 * [Albmina])

100

= 14,4

(IC95%: 8,3-20,5)

80

60

40

20

R2 = 0,16
1,6

1,8

2,0

2,2

2,4

2,6

2,8

3,0

3,2

3,4

3,6

3,8

4,0

ALBMINA
Variable PREDICTORA
Variable independiente, fija controlada por el investigador
Variable cuantitativa continua

Slo con la variable predictora incluida en el modelo (ALBMINA srica) slo se puede explicar el 16% de
la variabilidad de la variable resultado (PROTROMBINA), queda por explicar un 84% de la variabilidad que
es achacable a otras variables predictoras distintas no incluidas.

Pgina 683

C aptulo 7

Slo con la variable predictora


incluida en el modelo (horas
sentado) slo se puede explicar
el 0,6% de la variabilidad de la
variable resultado (IMC), queda
por explicar un 99,4% de la
variabilidad que es achacable
a otras variables predictoras
distintas no incluidas.

26,0

IMC (peso [Kg] / Talla 2 [m2])

El modelo (coeficiente ) indica


que por cada 10 horas que pasa
sentada una mujer a la semana
aumenta su peso en unos 800
gr.

Variable RESULTADO-RESPUESTA-posible EFECTO


Variable dependiente
Variable cuantitativa continua

Limitaciones del coeficiente de correlacin de Pearson


IMC = 23,5 + (0,03 * Horas sentada)
R2 = 0,006

25,5

25,0

24,5
24,0
23,5
23,0
0

10

20

30

40

50

60

70

80

Horas sentado / semana (tiempo libre)

Relacin entre el ndice de masa corporal (IMC) y las horas de estar sentado
a la semana en el tiempo libre.
Muestra representativa (n=7.926) mujeres de la Unin Europea
Variable PREDICTORA-EXPOSICIN-posible CAUSA
Variable independiente, fija controlada por el investigador
Variable cuantitativa continua

Pgina 684

C aptulo 7

Limitaciones del coeficiente de correlacin de Pearson


100

34

Indice de masa Corporal (IMC)

Glucemia (mg/dl)

90

1 = 0

32

1 = 0

80

70

60

30
28
26
24
22
20

10

20

30

40

50

10

20

30

40

Edad

50

60

70

80

Edad

Dos nubes de puntos con la misma pendiente 1 de valor cero que muestran dos situaciones muy diferentes.
A la izquierda ausencia de relacin. A la derecha relacin NO lineal.

NO se puede emplear el coeficiente de correlacin de Pearson

C aptulo 7

Limitaciones del coeficiente de correlacin de Pearson


Relacin
cuadrtica

y=a+b

y = a + b x2

1
X

Relacin
hiperblica

NO se puede emplear el coeficiente de correlacin de Pearson


Podemos encontrar cualquier tipo de funcin matemtica con claro apartamiento de la
linealidad.

Pgina 685

C aptulo 7

Pgina 686

Otros coeficientes de correlacin


- Cuando las variables en vez de ser numricas son ordinales, es posible
preguntarse sobre si hay algn tipo de correlacin entre ellas?
- Disponemos para estos casos de tres test estadsticos:
- (ro) de Spearman
- (tau) de Kendall
- Coeficiente de asociacin ordinal de Goodman-Kruscall (coefiente
gamma)
- Son estadsticos anlogos al coeficiente de correlacin lineal de Pearson r,
que aparecen en estudios donde las variables cuantitativas no son continuas
y/o no siguen una distribucin normal.
- El coeficiente de correlacin de Spearman es recomendable utilizarlo
cuando los datos presentan valores externos ya que dichos valores afectan
mucho el coeficiente de correlacin de Pearson, o ante distribuciones NO
normales.
n

rs = 1 -

6 di2
i =1

n ( n 2 - 1)

C aptulo 7

Coeficientes de correlacin
PEARSON

SPEARMAN

- Ambas variables deben seguir


la distribucin NORMAL
- Slo detecta asociaciones
lineales
- Las observaciones han de ser
independientes

- No requiere supuestos previos


de normalidad
- Detecta asociaciones distintas
de la lineal
- Es un mtodo no paramtrico
pero permite la construccin de
intervalos de confianza
- Estima el grado de asociacin
de cualquier tipo con
independencia de la funcin
matemtica que relaciona ambas
variables

Pgina 687

C aptulo 7

Pregunta de investigacin
Existe relacin entre la edad del paciente y la duracin de
la estancia en UCI?
Variable PREDICTORA 1
CUANTITATIVA continua
Edad
- Aos

Variable RESULTADO
CUANTITATIVA discreta
Estancia
- Das

Cul es el test estadstico ms acertado?

Pgina 688

C aptulo 7

Pgina 689

C aptulo 7

Das de estancia en UCI

80

Lnea continua ajuste mediante estimador robusto de


regresin medio ponderado
Lnea de trazos discontinuos: ajuste mediante mnimos
cuadrados

60
40

20
0
20

30

40

50

60

Edad del paciente

70

80

Pgina 690

C aptulo 7

Resultados
Coeficiente de correlacin de Spearman
Variable

Correlacin (r)

Significacin

Edad del paciente versus Estancia en UCI

22

0,614 (**)

0,002

Variable

Correlacin (r)

Significacin

Edad del paciente versus Estancia en UCI

22

0,470 (**)

0,003

Tau-b de Kendall

** La correlacin es significativa al nivel 0,01 (bilateral).


p < 0,01

Rechazamos la hiptesis nula

Pgina 691

C aptulo 7

Pregunta de investigacin
Existe relacin entre la intensidad del estudio y el rendimiento
acadmico en el examen del curso de Bioestadstica?

Variable PREDICTORA 1
Cuantitativa continua
Horas de estudio

Cul es el test estadstico ms acertado?

Variable RESULTADO
Cuantitativa discreta
Rendimiento acadmico

Pgina 692

C aptulo 7

Pgina 693

N del
Horas
Alumno de
estudio
(X1)

N
respuestas
correctas
(Y)

16

17

18

21

21

29

20

15

10

100

22

Nmero de respuestas correctas

Pregunta de investigacin: Existe relacin entre la intensidad del


estudio y el rendimiento acadmico en el examen del curso de
Bioestadstica?
20

r = 0.976 p< 0.001

15

10
5
0
10

Cul es el test estadstico ms acertado?

30

50

70

Nmero de horas de estudio

90

C aptulo 7

Resultados
Coeficiente de correlacin de Spearman
Variable

Correlacin (r)

Significacin

Horas de estudio versus Respuestas correctas

10

0,976 (**)

0,000

Variable

Correlacin (r)

Significacin

Horas de estudio versus Respuestas correctas

10

0,911 (**)

0,000

Tau-b de Kendall

** La correlacin es significativa al nivel 0,01 (bilateral).


p < 0,01

Rechazamos la hiptesis nula

Pgina 694

C aptulo 7

Pgina 695

Mito 1: La sonrisa de la esfinge


He observado que el individuo n 20 se aparta bastante de la tendencia del
grupo. De hecho si se eliminara se podra considerar una supuesta relacin
lineal.
Ests seguro que ese dato n 10 es correcto?Est bien tomado? Cmo
ests seguro de que ese individuo ha estudiado 100 horas? Qu medidas
has tomado para considerar la credibilidad de la variable predictora (horas de
estudio)?
No podra considerarse a ese individuo n 10 como un perifrico o
OUTLIER?

C aptulo 7

Pgina 696

Pregunta de investigacin
Existe relacin entre el coeficiente intelectual de los alumnos y el
rendimiento acadmico en el examen del curso de Bioestadstica?

Variable PREDICTORA 2
Cuantitativa discreta
Coeficiente intelectual

Cul es el test estadstico ms acertado?

Variable RESULTADO
Cuantitativa discreta
Rendimiento acadmico

C aptulo 7

Pgina 697

N del
Horas
Alumno de
estudio
(X 2)

N
respuestas
correctas
(Y)

104

125

16

115

18

100

100

140

21

112

130

20

125

15

10

122

22

Nmero de respuestas correctas

Pregunta de investigacin: Existe relacin entre el coeficiente


intelectual del alumno y el rendimiento acadmico en el examen
del curso de Bioestadstica?

20
15

r = 0.811 p< 0.01

10
5
0
100

Cul es el test estadstico ms acertado?

110

120

130

Coeficiente intelectual (CI)

140

C aptulo 7

Resultados
Coeficiente de correlacin de Spearman
Variable

Correlacin (r)

Significacin

Coeficiente intelectual versus respuestas correctas

10

0,811 (**)

0,004

Variable

Correlacin (r)

Significacin

Coeficiente intelectual versus respuestas correctas

10

0,705 (**)

0,005

Tau-b de Kendall

** La correlacin es significativa al nivel 0,01 (bilateral).


p < 0,01

Rechazamos la hiptesis nula

Pgina 698

C aptulo 7

Pgina 699

Pregunta de investigacin
Existe relacin entre las horas de asistencia a clase y el
rendimiento acadmico en el examen del curso de Bioestadstica?

Variable PREDICTORA 3
Cuantitativa continua
Horas de asistencia a clases

Cul es el test estadstico ms acertado?

Variable RESULTADO
Cuantitativa discreta
Rendimiento acadmico

Pgina 700

C aptulo 7

N del
Horas
Alumno de
estudio
(X3)

N
respuestas
correctas
(Y)

23

92

16

78

18

15

20

100

21

35

95

20

75

15

10

100

22

Nmero de respuestas correctas

Pregunta de investigacin: Existe relacin entre las horas de


asistencia a clase y el rendimiento acadmico en el examen del
curso de Bioestadstica?
r = 0.985 p< 0.01

20

15

10

0
25

Cul es el test estadstico ms acertado?

50

75

Horas de asistencia a clase

100

C aptulo 7

Resultados
Coeficiente de correlacin de Spearman
Variable

Correlacin (r)

Significacin

Asistencia a clase versus respuestas correctas

10

0,985 (**)

0,000

Variable

Correlacin (r)

Significacin

Asistencia a clase versus respuestas correctas

10

0,944 (**)

0,000

Tau-b de Kendall

** La correlacin es significativa al nivel 0,01 (bilateral).


p < 0,01

Rechazamos la hiptesis nula

Pgina 701

C aptulo 7

Resumen de los resultados de correlacin bivariante


Variables predictoras

Rho Spearman

Significacin

Tau de Kendall

Significacin

Horas de estudio

0,976

0,000

0,911

0,000

Coeficiente intelectual

0,811

0,004

0,705

0,005

Asistencia a clase

0,985

0,000

0,944

0,000

Variable resultado: Rendimiento acadmico (nmero de respuestas correctas)

Existe relacin entre las distintas variables predictoras?


COLINEALIDAD?

Pgina 702

C aptulo 7

Pregunta de investigacin
Existe relacin entre las horas dedicadas al estudio por el
alumno y el coeficiente intelectual de los alumnos del curso
de Bioestadstica?
Variable PREDICTORA 1
Cuantitativa continua
Horas de estudio

Cul es el test estadstico ms acertado?

Variable PREDICTORA 2
Cuantitativa discreta
Coeficiente intelectual

Pgina 703

C aptulo 7

Resultados
Coeficiente de correlacin de Spearman
Variable

Correlacin (r)

Significacin

Horas de estudio versus coeficiente intelectual

10

0,787 (**)

0,007

** La correlacin es significativa al nivel 0,01 (bilateral).

Tau-b de Kendall
Variable

Correlacin (r)

Significacin

Horas de estudio versus coeficiente intelectual

10

0,614 (*)

0,015

* La correlacin es significativa al nivel 0,05 (bilateral).


p < 0,05

Rechazamos la hiptesis nula

Pgina 704

C aptulo 7

Pregunta de investigacin
Existe relacin entre las horas de estudio del alumno y las
horas de asistencia a clase del curso de Bioestadstica?

Variable PREDICTORA 1
Cuantitativa continua
Horas de estudio

Cul es el test estadstico ms acertado?

Variable PREDICTORA 3
Cuantitativa continua
Horas de asistencia a clases

Pgina 705

C aptulo 7

Resultados
Coeficiente de correlacin de Spearman
Variable

Correlacin (r)

Significacin

Horas de estudio versus asistencia a clase

10

0,954 (**)

0,000

** La correlacin es significativa al nivel 0,01 (bilateral).

Tau-b de Kendall
Variable

Correlacin (r)

Significacin

Horas de estudio versus asistencia a clase

10

0,854 (**)

0,001

** La correlacin es significativa al nivel 0,01 (bilateral).


p < 0,05

Rechazamos la hiptesis nula

Pgina 706

C aptulo 7

Pregunta de investigacin
Existe relacin entre el coeficiente intelectual del alumno y
las horas de asistencia a clase del curso de Bioestadstica?

Variable PREDICTORA 2
Cuantitativa discreta
Coeficiente intelectual

Cul es el test estadstico ms acertado?

Variable PREDICTORA 3
Cuantitativa continua
Horas de asistencia a clases

Pgina 707

C aptulo 7

Resultados
Coeficiente de correlacin de Spearman
Variable

Correlacin (r)

Significacin

Coeficiente intelectual versus asistencia a clase

10

0,869 (**)

0,001

** La correlacin es significativa al nivel 0,01 (bilateral).

Tau-b de Kendall
Variable

Correlacin (r)

Significacin

Coeficiente intelectual versus asistencia a clase

10

0,782 (**)

0,002

** La correlacin es significativa al nivel 0,01 (bilateral).


p < 0,05

Rechazamos la hiptesis nula

Pgina 708

C aptulo 7

Variable PREDICTORA 1
Cuantitativa
Horas
de estudio

Variable PREDICTORA 2
Cuantitativa

Variable RESULTADO
Cuantitativa

Coeficiente
intelectual

Rendimiento
acadmico

Variable PREDICTORA 3
Cuantitativa
Horas de
asistencia a clases

Pgina 709

C aptulo 7

Pgina 710

C aptulo 7

Qu relacin existe entre el consumo de cigarrillos y los


niveles de cadmio en sangre?
Cuantitativa discreta
Consumo de cigarrillos
Nmero de cigarrillos
consumidos por da

Cul es el test estadstico ms acertado?

Cuantitativa continua
Cadmio en sangre
Niveles sricos de cadmio
(g/L)

Pgina 711

C aptulo 7

r = 0,532 p = 0,001

Pgina 712

C aptulo 7

Med Clin (Barc) 2006;127:41-6.

Pgina 713

C aptulo 7

Pgina 714

C aptulo 7

Pregunta de investigacin
Qu relacin y que grado de asociacin existe entre el
ndice de actividad clnica de las enfermedades inflamatorias
intestinales (EII) y los niveles de calprotectina fecal?
Variable PREDICTORA
Cuantitativa continua
Calprotectina fecal

Variable RESULTADO
Cuantitativa discreta
ndice de actividad de la enfermedad
inflamatoria intestinal (HarveyBradshaw modificado para colitis
ulcerosa y enfermedad de Crohn)

Pgina 715

C aptulo 7

ndice de Harvey-Bradshaw

Qu tipo de variable es el ndice de Harvey-Bradshaw?

Pgina 716

C aptulo 7

Coeficiente de correlacin
Rho de Spearman

15
ndice de Harvey- Bradshaw

ndice de actividad clnica

20

r = 0,719 p < 0,01

10

0
0

1.000 2.000

3.000 4.000 5.000 6.000

Calprotectina fecal (g/g)

Cul es la prueba estadsticas ms adecuada?

7.000 8000

Pgina 717

C aptulo 7

Pgina 718

Anlisis estadstico (fragmento del texto)

El anlisis de los datos se llev a cabo mediante el programa estadstico SPSS 11.0. El
valor de la CPF se presenta como media y con un intervalo de confianza (IC) del 95%.
Se utiliz el test de Kruskal-Wallis para evaluar las diferencias entre los valores de CPF
entre los diferentes grupos y el coeficiente de Spearman para valorar la correlacin entre
este marcador y el ndice de actividad de la enfermedad en el grupo de pacientes con
enfermedad inflamatoria intestinal (EII).

C aptulo 7

Pgina 719

Resultados (fragmento del texto)


En la figura 2 se muestra la correlacin positiva entre la concentracin de la CPF y
el ndice de actividad de la enfermedad en pacientes con enfermedades inflamatoria
intestinales (EII) (enfermedad de Crohn (EC) y colitis ulcerosa (CU)) (r = 0,719, p < 0,01).

Discusin (fragmento del texto)


El presente trabajo muestra que la concentracin de CPF est significativamente elevada
en pacientes con procesos orgnicos en colon, fundamentalmente en el cncer colorrectal
y enfermedad inflamatoria intestinal (EII). Adems, los valores ms altos se alcanzan
en pacientes con EII, y sus valores se correlacionan con el grado de actividad de la
enfermedad.

C aptulo 7

Pregunta de investigacin
Qu relacin y qu grado de asociacin existe entre el nivel
de conocimientos mdicos actualizados sobre el mejor tratamiento posible y el tiempo transcurridos desde la graduacin?
Variable PREDICTORA
Cuantitativa continua
Aos desde la graduacin

Variable RESULTADO
Cuantitativa discreta
Conocimientos actualizados
sobre el mejor tratamiento posible
(medidos segn escala de MBE)

Pgina 720

C aptulo 7

Conocimientos actualizados sobre el mejor


tratamiento posible (niveles de evidencia)

Coeficiente de correlacin Rho de Spearman

. ..

. . .... .
...
...

r = - 0,54
p < 0,001

...
....
....

Una Pendiente Resbaladiza


Aos desde la graduacin

...
..

Pgina 721

C aptulo 7

Estudios ecolgicos
Seven
Countries
Study

EE.UU
Ferroviarios

FINLANDIA
HOLANDA
Zutphen

ITALIA
Crevalcore
GRECIA
Montegiorgio
Creta
Roma
Corfu

YUGOSLAVIA
Belgrado
Dalmacia
Eslavonia
Velika Krsna
Zrenjanin

JAPON
Tanushimaru
Ushibuka

Pgina 722

C aptulo 7

Estudio ecolgico

Variable PREDICTORA
Factor de exposicin (F)
Grasas saturadas

cidos grasos saturados


de la dieta (% de aporte
calrico)
Cul es el test estadstico ms acertado?

Variable RESULTADO
Efecto o Enfermedad (E)
Cardiopata coronaria

Tasas de mortalidad por


cardiopata coronaria

Pgina 723

C aptulo 7

Pgina 724

Fallecimiento por cardiopata coronaria (%)

Estudio ecolgico
5

Coeficiente de correlacin r de Spearman

3
2

MC
DB

V
0

N
W
r = 0,84

5
10
15
20
25
cidos grasos saturados en la dieta (% de aporte calrico)

Tasa de mortalidad por cardiopata coronaria en funcin del contenido en cidos grasos saturados de la
dieta (% del aporte calrico). Ambas variables estn significativamente correlacionadas segn un amplio
estudio (Seven Countries Study) llevado a cabo en diferentes grupos de poblacin. B = Belgrado, C=
Crevalcore, D= Dalmacia, E = este de Finlandia, G = Corf, K = Creta, N = Zutphen, M = Montegiorgio, S
= Eslavonia, T = Tanushimaru, U = empleados de ferrocarriles de EEUU, V = Velika Krsna, W = oeste de
Finlandia, Z = Zrenjarin.

C aptulo 7

Estudio ecolgico

Variable PREDICTORA
Factor de exposicin (F)
Grasas saturadas

cidos grasos saturados


de la dieta (% de aporte
calrico)
Cul es el test estadstico ms acertado?

Variable RESULTADO
Efecto o Enfermedad (E)
Colesterolemia

Tasas de colesterol en
sangre (mg/dl)

Pgina 725

C aptulo 7

Pgina 726

Estudio ecolgico
Coeficiente de correlacin r de Spearman

280

W E

Colesterolemia (mg/dl)

260
240
220

200
180

160

B
K Z
S
MC
D

U N
r = 0,89

140

10

15

20

25

cidos grasos saturados en la dieta (% de aporte calrico)


Valores de colesterol en sangre en relacin con el contenido en cidos grasos saturados de la dieta (%
del aporte calrico). Ambas variables estn significativamente correlacionadas segn un amplio estudio
(Seven Countries Study) llevado a cabo en diferentes grupos de poblacin. B = Belgrado, C= Crevalcore,
D= Dalmacia, E = este de Finlandia, G = Corf, K = Creta, N = Zutphen, M = Montegiorgio, S = Eslavonia,
T = Tanushimaru, U = empleados de ferrocarriles de EEUU, V = Velika Krsna, W = oeste de Finlandia, Z =
Zrenjarin.

C aptulo 8

Captulo 8
Publicacin Bioestadstica: Anlisis bivariante.
Test de contraste de hiptesis.
Cualitativa dicotmica versus cuantitativa.

Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Pgina 727

C aptulo 8

Pgina 728

Materiales y mtodos
Estructura
1. Tipo de diseo (estudio).
2. Sujetos incluidos (criterios de seleccin de la muestra)
3. Fuentes de informacin.
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales).
5. Instrumentos y procedimientos de medida (cuestionarios).
6. Definicin de las variables y covariables incluidas en el estudio (factor de
estudio y criterio de evaluacin).
7. Limitaciones y consideraciones ticas de la investigacin.
8. Pruebas estadsticas a utilizar (programa estadstico).

C aptulo 8

Fases del anlisis estadstico


1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE

Pgina 729

C aptulo 8

Decisiones que se pueden tomar en un test de contraste


de hiptesis despus de conocer el valor de significacin
estadstica p
p < 0,05

AB

p 0,10

A=B

Se rechaza la hiptesis nula

No se puede rechazar la hiptesis nula

No parece que el azar pueda


explicarlo todo

No se puede descartar que el azar lo


explique todo

El EFECTO observado es mayor que


el ERROR

El EFECTO observado es similar que el


ERROR

Hay diferencias estadsticamente


significativas

NO hay diferencias estadsticamente


significativas

Existen evidencias a favor de la


hiptesis alternativa Ha, y por tanto
rechazamos la hiptesis nula Ho

NO existen evidencias a favor de la


hiptesis alternativa Ha, y por tanto
aceptamos la hiptesis nula Ho

Los lmites de 0,05 y 0,1 pueden ser considerados en cierto modo


arbitrarios y aproximados

Pgina 730

C aptulo 8

Anlisis estadstico
Tipos de test analticos estadsticos de contraste de hiptesis
segn el tipo de variables implicadas en el estudio
Variable dependiente
Variable resultado
Variable
Predictora
Variable
Independiente

Dicotmica

Continua

Dicotmica

Test de 2

t de Student

Continua

Regresin logstica

Regresin lineal

Pgina 731

C aptulo 8

Anlisis estadstico

ANLISIS ESTADSTICO
Variable
Predictora
Variable
Independiente

Variable resultado
Dicotmica

Continua

Dicotmica

Test de 2

t de Student

Continua

Regresin logstica

Regresin lineal

t de Student

Pgina 732

C aptulo 8

Pgina 733

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable
Independiente o
PREDICTORA

Variable
Dependiente o
RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de Fisher
Test de McNemar
Q de Cochran
REGRESIN LOGSTICA

Si el tamao muestral es grande


Si el tamao muestral es pequeo
Dos grupos de muestras repetidas o apareadas
Ms de dos grupos de muestras repetidas o apareadas
Varias variables predictoras cualitativas

Cualitativa

Cuantitativa

t de Student
Anlisis de la Varianza
Test de Mann-Whitney
Test de Wilcoxon
Test de Kruskall-Wallis
Test de Friedman

Compara medias entre dos grupos independientes


Compara medias entre ms de dos grupos independientes
Dos grupos independientes No paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, medidas repetidas
Ms de dos grupos No paramtrico medidas repetidas

Cuantitativa

Cualitativa

Regresin logstica simple


Regresin logstica multivariante

Una sola variable predictora cuantitativa


Varias variable predictoras cuantitativa o cualitativas

Cuantitativa

Cuantitativa

Regresin lineal simple


Correlacin de Pearson
Correlacin de Sperman
REGRESIN MLTIPLE

Paramtrico
Paramtrico
No paramtrico
Varias variables predictoras cuantitativas

Cualitativa

Superviviencia

Kaplan-Meier
Long-Rank
Regresin de COX

Curvas de superviviencia
Compara curvas de superviviencia
Anlisis Multivariante

C aptulo 8

Pgina 734

Tipos de test analticos estadsticos bivariantes de contraste


de hiptesis ms frecuentes
Variable
PREDICTORA o
Independiente (factor
de estudio)

Variable RESULTADO o Dependiente (Criterio de evaluacin)


Cualitativa nominal
dos
categoras

Cualitativa nominal
>2
categoras

Cualitativa ordinal o
Cuantitativa NO
paramtrica

Cuantitativa
paramtrica

Cualitativa dos grupos


independientes

Chi cuadrado
Z comparacin de
proporciones
Test exacto de
Fisher

Chi cuadrado

U de Mann-Whitney

T de Student
(prueba de Welch)

Cualitativa dos grupos


apareados

Test de McNemar

Q de Cochran

Prueba de los
rangos
de Wilcoxon

T de Student
para datos
emparejados

Cualitativa > 2 grupos


independientes

Chi cuadrado

Chi cuadrado

Prueba de KruskalWallis

Anlisis de la Varianza
(ANOVA)

Cualitativa > 2 grupos


apareados

Q de Cochran

Q de Cochran

Prueba de Friedman

Anlisis de la Varianza
de dos vas

Cuantitativa

Regresin logstica

Regresin logstica

Correlacin de
Sperman
Tau de Kendall

Regresin lineal
Correlacin de Pearson

C aptulo 8

Cualitativa versus cuantitativa


Cules son las pruebas estadsticas que tenemos que emplear?

Variable PREDICTORA
CUALITATIVA dicotmica

Variable RESULTADO
CUANTITATIVA

Pgina 735

C aptulo 8

Cualitativa dicotmica versus cuantitativa


PARAMTRICOS

NO PARAMTRICOS

2 GRUPOS

U de Mann-Whitney

Independientes

T de Student para muestras independientes

Aparejados

T de Student para muestras apareadas

Wilcoxon

Variable predictora Cualitativa versus variable resultado Cuantitativa.

Pgina 736

C aptulo 8

Pgina 737

Test de la T de Student para dos muestras independientes


Condiciones de aplicacin (1)
- n1 y n2 >= 30
- Normalidad (Requisitos necesarios)
- Comprobar que el mximo y el mnimo quedan dentro del intervalo
definido por 3 DE por encima y por debajo de la media (media 3 DE)
- Que la asimetra (en valor absoluto) sea menor que dos veces el error
estndar [asimetra] < 2 EE de asimetra
- Que la curtois (en valor absoluto) sea menor que 2 veces su EE [Curtois] <
2 EE de curtois

Test de Kolmogorov-Smirnov
Test de Shapiro-Wilks

C aptulo 8

Pgina 738

Test de la T de Student para dos muestras independientes


Condiciones de aplicacin (2)
Homogeneidad de varianzas (homoscedasticidad)
- Prueba F de Snedecor
- Test de Barttlet
Varianza mayor
- Test de Levene
F=
Varianza menor
Ho: Las varianzas de ambos grupos son iguales

Test T de Student

Ha: Existen diferencias entre las varianzas

Test de Welch

Fcalculada < Ftabulada

p>0,05 (aceptamos la Ho)

Fcalculada > Ftabulada

p<0,05 (rechazamos la hiptesis nula)

C aptulo 8

Pregunta de investigacin
El peso al nacer de los varones difiere del peso al nacer de
las mujeres?
Variable PREDICTORA
CUALITATIVA dicotmica
Sexo

Variable RESULTADO
CUANTITATIVA continua
Peso (Kg)

Cul es la prueba estadstica ms adecuada?

Pgina 739

C aptulo 8

Test de la T de Student:
Muestras independientes
Hiptesis nula Ho: El peso al nacer de los varones NO difiere del peso al
nacer de las mujeres
Hiptesis alternativa Ha: El peso al nacer de los varones difiere del peso al
nacer de las mujeres
Peso al nacer del RN
Varones

Mujeres

Media

3380,3

3246,8

Desviacin estndar (S)

417,3

388,0

833

789

t calculada =

X1 X2
(n 1) S12 + (m 1) S22
(n + m 2)

1
n

1
m

tcalculada= 6,666

Pgina 740

C aptulo 8

Test de la T de Student para muestras independientes


Grados de libertad (g.l) = n + m - 2

gl = 883 + 789 - 2 = 1620

Peso del RN

Varones

Mujeres

883

789

Media

3380,34

3246,79

Desviacin estndar

417,28

388,0

EEM

14,46

13,81

t calculada

6,666

Grados de libertad

1620

Significacin (bilateral)

0,000

t calculada= 6,666 > t tabulado = 1,96;

p < 0,001

Ha: El peso al nacer de los varones difiere del peso al nacer de las mujeres

Pgina 741

C aptulo 8

Distribucin de la t de Student

= n-1

Grados de libertad = n - 1

valores " t " : t =

(x - )
s

Pgina 742

C aptulo 8

Distribucin de la t de Student (gl 30)


El test de la T de Student para muestras de ms de 30 individuos presenta
una distribucin muy similar a la distribucin normal tipificada Z.
El test de la T de Student es una prueba BILATERAL, y por tanto NO
especifica la direccin de la diferencia ( A B).
Nivel de significacin
estadstica = 0,05

t calculada = 6,666

Z 1- /2

Z 1- /2

- 1,96

1,96

t tabulado = 1,96 para los grados de libertad de la muestra (1620)

Pgina 743

C aptulo 8

Pgina 744

Interpretacin del valor de la t de Student (t=6,666)

- La diferencia observada (t calculada= 6,666) es muy grande en relacin a


la variabilidad aleatoria esperada (t tabulada) , y por tanto existen diferencias
significativas (p<0,001)
- El efecto observado (diferencia entre el peso de los dos sexos) es muy
superior a la variabilidad biolgica esperada.
- El efecto observado (diferencia entre el peso de los dos sexos) es
importante, es decir mucho mayor de lo esperado por el azar.
- El valor de la t tabulada para un error alfa del 5% es muy inferior al encontrado
t tabulado < t calculada
- El valor de la p (p < 0,001) indica que existe una probabilidad muy baja
(<0,1%) de observar al menos estas diferencias en los pesos por efecto del
AZAR y no porque los varones tengan distinto peso que las mujeres.

C aptulo 8

Pregunta de investigacin
Tiene influencia el tipo de dieta (pescado/huevos) seguida
en el peso del individuo?
Variable PREDICTORA
CUALITATIVA dicotmica
Tipo de dieta

Variable RESULTADO
CUANTITATIVA continua
Peso (Kg)

Pgina 745

C aptulo 8

Test de la T de Student:
Muestras independientes
Hiptesis nula Ho
Hiptesis alternativa H1

(ambas dietas tienen igual efecto)


(las dietas tienen distinto efecto)

Variable PREDICTORA
Cualitativa discreta y dicotmica: TIPO DE DIETA (pescado o huevos)
Variable RESULTADO
Cuantitativa continua: Kg adelgazados durante los 3 meses que dur la dieta
Personas que siguen la dieta
P a base de pescado n=19
Personas que siguen la dieta
H a base de huevo n=10

Variable PREDICTORA
Cualitativa discreta y
dicotmica:
TIPO DE DIETA

Variacin en el peso (kg)


Variacin en el peso (kg)

3 meses

Martnez Gonzlez MA, Jokin de Irala Estvez, Faulin Fajardo FJ. Bioestadstica amigable. Madrid:
Ediciones Daz de Santos; 2001.

Pgina 746

C aptulo 8

Personas que siguen la dieta


P a base de pescado n=19

Personas que siguen la dieta


H a base de huevo n=10

ID

DIETA

REDUCCION PESO (Kg)

ID

DIETA

REDUCCION PESO
(Kg)

PESCADO

19

20

HUEVOS

23

PESCADO

28

21

HUEVOS

23

PESCADO

17

22

HUEVOS

23

HUEVOS

14

PESCADO

15

24

HUEVOS

22

25

HUEVOS

20

26

HUEVOS

27

HUEVOS

12

PESCADO

16

PESCADO

21

PESCADO

27

28

HUEVOS

18

PESCADO

18

29

HUEVOS

33

PESCADO

15

30

10

PESCADO

10

11

PESCADO

10

12

PESCADO

13

PESCADO

12

14

PESCADO

13

15

PESCADO

19

16

PESCADO

17

PESCADO

29

18

PESCADO

35

19

PESCADO

38

Media

18,579

Desviacin estndar

9,26

Varianza

85,8

Variable RESULTADO
Cuantitativa continua

HUEVOS

19

Media

17,545

Desviacin estndar

8,43

Varianza

71,1

Variable RESULTADO
Cuantitativa continua

t calculada =

X1 X2

t calculada = 0,3

(n 1) S12 + (m 1) S22
(n + m 2)

1
n

1
m

t calculada= 0,3 < t tabulado p = 0,76

Pgina 747

C aptulo 8

Pgina 748

Test de la T de Student:
Muestras independientes
Test de la t de Student
t

calculada < t tabulada

p > 0,05

calculada > t tabulada


p < 0,05

Hiptesis nula H0

Hiptesis alternativa Ha

Las medias de la reduccin


del peso en los dos grupos
comparados es independiente de
la intervencin diettica

Las medias de la reduccin


del peso en los dos grupos
comparados son diferentes
entre s, es decir NO pueden
considerarse iguales

t calculada = 0,3 < t tabulado

p = 0,76

Tienen el mismo efecto las dietas ensayadas para reducir el peso corporal?
S

C aptulo 8

Pgina 749

Interpretacin del valor de la t de Student (t=0,30)

- La diferencia observada (t calculada= 0,3) es pequea en relacin a la


variabilidad aleatoria esperada (t tabulada) , y por tanto no existen diferencias
significativas (p>0,05)
- El efecto observado (diferencia entre las dos dietas) es slo del 30% de la
variabilidad biolgica esperada.
- El efecto observado (diferencia entra las dos dietas) es insignificante, es
decir mucho menor de lo esperado por el azar.
- El valor de la t tabulada para un error alfa del 5% es superior al encontrado
t tabulado > t calculada
- El valor de la p (p = 0,76) indica que existe una probabilidad muy alta (76%)
de observar al menos estas diferencias en la reduccin del peso si la muestra
procediese de una poblacin donde las dos dietas tienen el mismo efecto (las
diferencias observadas son producidas por el AZAR y no porque las dietas
tengan distinto efecto).

C aptulo 8

Pgina 750

Test de la T de Student para dos muestras independientes


Condiciones de aplicacin (1)
- n1 y n2 >= 30
- Normalidad (Requisitos necesarios)
- Comprobar que el mximo y el mnimo quedan dentro del intervalo
definido por 3 DE por encima y por debajo de la media (media 3 DE)
- Que la asimetra (en valor absoluto) sea menor que dos veces el error
estndar [asimetra] < 2 EE de asimetra
- Que la curtois (en valor absoluto) sea menor que 2 veces su EE [Curtois] <
2 EE de curtois

Test de Kolmogorov-Smirnov
Test de Shapiro-Wilks

C aptulo 8

Pgina 751

Test de la T de Student para dos muestras independientes


Condiciones de aplicacin (2)
Homogeneidad de varianzas (homoscedasticidad)
- Prueba F de Snedecor
- Test de Barttlet
Varianza mayor
- Test de Levene
F=
Varianza menor
Ho: Las varianzas de ambos grupos son iguales

Test T de Student

Ha: Existen diferencias entre las varianzas

Test de Welch

Fcalculada < Ftabulada

p>0,05 (aceptamos la Ho)

Fcalculada > Ftabulada

p<0,05 (rechazamos la hiptesis nula)

C aptulo 8

Pgina 752

Mito 1: La sonrisa de la esfinge


La t de Student es un test paramtrico, es decir para usarlo se debe
cumplir la normalidad de la variable cuantitativa. Se cumple?Como lo has
comprobado?
He observado que en los dos grupos de estudio comparados slo tienen 19 y
11 sujetos respectivamente. Ante tan bajo volumen muestral (n < 30),
Cmo justificas esa supuesta normalidad?Que test has empleado para
comprobar esa normalidad de la reduccin del peso? Ests seguro que se
cumplen los criterios para poder usar la t de Student ? Se cumplen todos los
requisitos para su utilizacin?

C aptulo 8

Pgina 753

Realidad 1: Respuesta de Edipo


Test de Kolmogorov-Smirnov
Reduccin del peso

Tipo de dieta

Estadstico

g.l

Significacin

Pescado

0,166

19

0,178

Huevos

0,168

11

0,200

Test de Shapiro-Wilk
Reduccin del peso

Tipo de dieta

Estadstico

g.l

Significacin

Pescado

0,956

19

0,493

Huevos

0,950

11

0,615

Ho: p > 0,05 test paramtricos

Ha: p < 0,05 test NO paramtricos

Los test de normalidad ensayados dan un valor de p NO significativo (p >0,05) en ambos


grupos (tipos de dieta). Por tanto no hay evidencias suficientes para rechazar la hiptesis
nula de normalidad de la variable reduccin del peso en ambas muestras.

C aptulo 8

Pgina 754

C aptulo 8

Pgina 755

C aptulo 8

+ IC95%

+ IC95%

Media Kg pescado
Media Kg huevos

- IC95%
- IC95%

Pgina 756

C aptulo 8

Pregunta de investigacin
Existen diferencias en los valores del VCM en sangre en
funcin de los depsitos de hierro normales o ferropnicos
en mdula sea?
Variable PREDICTORA
CUALITATIVA dicotmica
Depsitos de Fe en mdula sea
Normal =1
Dficit = 0

Variable RESULTADO
CUANTITATIVA continua
VCM
(hemograma)

Cul es el test estadstico ms acertado?

Pgina 757

C aptulo 8

Pgina 758

C aptulo 8

Pgina 759

C aptulo 8

Test de la T de Student para muestras independientes


Grados de libertad (g.l) = n + m - 2

gl = 67 + 33 - 2 = 98

VCM

Medula normal

Dficit de hierro

67

33

Media

83,56

76,89

Desviacin estndar

8,588

9,323

EEM

1,049

1,623

t calculada

3,560

Significacin (bilateral)

0,001

Grados de libertad

t calculada = 3,560 > t tabulado = 1,96;

98

p < 0,001

Ha: El VCM es depende de los depsitos medulares de hierro.

Pgina 760

C aptulo 8

Pregunta de investigacin
Existen diferencias en los valores de la ferritina en sangre en
funcin de los depsitos de hierro normales o ferropnicos
en mdula sea?
Variable PREDICTORA
CUALITATIVA dicotmica
Depsitos de Fe en mdula sea
Normal =1
Dficit = 0

Variable RESULTADO
CUANTITATIVA continua
FERRITINA srica

Cul es el test estadstico ms acertado?

Pgina 761

C aptulo 8

Pgina 762

C aptulo 8

Test de Welch para desigualdad de varianzas


FERRITINA srica

Mdula normal

Dficit de hierro

67

33

Media

21,76

12,61

Desviacin estndar

9,165

5,528

EEM

1,120

0,962

T calculada

6,201

Grados de libertad

93,876

Significacin (bilateral)

0,000

t calculada = 3,560 > t tabulado = 1,96;

p < 0,001

Ha: El ferritina srica depende de los depsitos medulares de hierro.

Pgina 763

C aptulo 8

Pgina 764

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los niveles
de anticuerpos frente al virus de la Rubeola en la poblacin gestante
inmunizada de Ceuta en el ao 1994?
Variable PREDICTORA
Cualitativa dicotmica
Cristianas inmunizadas
Musulmanas inmunizadas

Variable RESULTADO
Cuantitativa continua
Virus de la Rubeola

Cul es el test estadstico ms adecuado?

C aptulo 8

Pgina 765

Test de t de Student para muestras independientes


P < 0,001

Figura 1.- Ttulos de anticuerpos frente al virus de la Rubeola en gestantes inmunizadas de Ceuta en 1994.
Distribucin por grupos culturales.

C aptulo 8

Pgina 766

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los niveles
de anticuerpos frente al virus de la Rubeola en la poblacin gestante
inmunizada de Ceuta en el ao 2010?
Variable PREDICTORA
Cualitativa dicotmica
Cristianas inmunizadas
Musulmanas inmunizadas

Variable RESULTADO
Cuantitativa continua
Virus de la Rubeola

Cul es el test estadstico ms adecuado?

C aptulo 8

Test de la T de Student para muestras independientes


Grados de libertad (g.l) = n + m - 2

gl = 234 + 487 - 2 = 719

IgG-anti-RUBEOLA

Cristianas

Musulmanas

234

487

Media

133,20

94,90

Desviacin estndar

197,26

100,69

EEM

12,89

4,56

t calculada

3,452

Grados de libertad

719

Significacin (bilateral)

t calculada = 3,452 > t tabulado = 1,96;

0,001

p < 0,001

Ha: Los niveles de IgG anti-Rubeola depende del grupo cultural, siendo distintos en
cristianas y musulmanas.

Pgina 767

C aptulo 8

Pgina 768

Test de t de Student para muestras independientes


(varianzas desiguales)

Ttulos de anticuerpos IgG anti-RUBEOLA (UI/ml)

p = 0,006

133,2

94,9

Figura 2.- Ttulos de anticuerpos frente al virus de la Rubeola en gestantes inmunizadas de Ceuta en 2010.
Distribucin por grupos culturales.

C aptulo 8

Mito 1: La sonrisa de la esfinge

Para poder usar la t de Student para muestras independientes es


necesario, entre otras condiciones, la homogeneidad de las varianzas
(homocedasticidad) de la variable cuantitativa.
La variable cuantitativa niveles de anticuerpos IgG anti-RUBEOLA
(UI/ml) en la poblacin gestante inmunizada de Ceuta cumple la
homocedasticidad?
Que test has empleado para comprobar que se cumple la homogeneidad
de las varianzas?

Pgina 769

C aptulo 8

Test de Levene para homocedasticidad


Test de Levene para la igualdad de varianzas

IgG-anti-RUBEOLA

14,498

Significacin

0,000

Ho: Las varianzas de ambos grupos son iguales.


Ha: Existen diferencias entre las varianzas.
Fcalculada > Ftabulada

Test de Welch

p < 0,05 (rechazamos la hiptesis nula)

Pgina 770

C aptulo 8

Test de Welch para desigualdad de varianzas

IgG-anti-RUBEOLA

Cristianas

Musulmanas

234

487

Media

133,20

94,90

Desviacin estndar

197,26

100,69

EEM

12,89

4,56

T calculada

2,800

Grados de libertad

292,8

Significacin (bilateral)

0,005

tcalculada= 2,800 > ttabulado = 1,96;

p < 0,01

Ha: Los niveles de IgG anti-Rubeola depende del grupo cultural, siendo distintos en
cristianas y musulmanas.

Pgina 771

C aptulo 8

Pgina 772

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los niveles de
anticuerpos frente a Toxoplasma en la poblacin gestante inmunizada
de Ceuta en el ao 1994?
Variable PREDICTORA
Cualitativa dicotmica
Cristianas inmunizadas
Musulmanas inmunizadas

Variable RESULTADO
Cuantitativa continua
Virus de la Rubeola

Cul es el test estadstico ms adecuado?

C aptulo 8

Test de t de Student para muestras independientes

Ttulos de IgG anti-toxoplasma (UI/ml)

p > 0,1

35,5

32,8

Figura 1.- Ttulos de anticuerpos frente a Toxoplasma en gestantes inmunizadas de Ceuta en 1994.
Distribucin por grupos culturales.

Pgina 773

C aptulo 8

Pgina 774

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los niveles de
anticuerpos frente a Toxoplasma en la poblacin gestante inmunizada
de Ceuta en el ao 2010?
Variable PREDICTORA
Cualitativa dicotmica
Cristianas inmunizadas
Musulmanas inmunizadas

Variable RESULTADO
Cuantitativa continua
Toxoplasma

Cul es el test estadstico ms adecuado?

C aptulo 8

Test de t de Student para muestras independientes

p > 0,1

78,6
67,9

Figura 2.- Ttulos de anticuerpos frente a Toxoplasma en gestantes inmunizadas de Ceuta en 2010.
Distribucin por grupos culturales.

Pgina 775

C aptulo 8

Mito 1: La sonrisa de la esfinge

La t de Student para muestras independientes es un test paramtrico, es


decir para usarlo se debe cumplir la normalidad de la variable cuantitativa.
La variable cuantitativa niveles de anticuerpos (UI/ml) en la poblacin
gestante inmunizada de Ceuta sigue una distribucin normal?
No encuentro datos estadsticos de dispersin (desviacin tpica)
Cmo justificas esa supuesta normalidad? Qu test has empleado para
comprobar que se cumple la normalidad (campana de Gauss)?

Pgina 776

C aptulo 8

Test de normalidad

Test de Kolmogorov-Smirnov

Ao 2010

Media

DE

Estadstico Z

Significacin

Niveles de anticuerpos IgG


anti-RUBEOLA

721

107,3

140,6

6,870

0,000

Test de normalidad

Test de Kolmogorov-Smirnov

Ao 2010

Tipo de cultura

Media

DE

Estadstico Z

Significacin

Niveles de
anticuerpos
IgG antiRUBEOLA

Cristianas

234

133,2

197,3

4,211

0,000

Musulmanas

487

94,9

100,7

4,723

0,000

Ho: p > 0,05 test paramtricos

Pgina 777

Ha: p < 0,05 test NO paramtricos

Los test de normalidad ensayados dan un valor de p significativo (p <0,05) en ambos


grupos culturales. Por tanto hay evidencias suficientes para rechazar la hiptesis nula de
normalidad de la variable reduccin del peso en ambas muestras. NO PODEMOS USAR
TEST PARAMTRICOS.

C aptulo 8

Test de normalidad

Test de Kolmogorov-Smirnov

Ao 2010

Media

DE

Estadstico Z

Significacin

Niveles de anticuerpos IgG


anti-RUBEOLA

297

77,5

133,6

5,321

0,000

Test de normalidad

Test de Kolmogorov-Smirnov

Ao 2010

Tipo de cultura

Media

DE

Estadstico Z

Significacin

Niveles de
anticuerpos
IgG antiRUBEOLA

Cristianas

32

67,9

58,6

1,260

0,084

Musulmanas

265

78,62

139,9

5,110

0,000

Ho: p > 0,05 test paramtricos

Pgina 778

Ha: p < 0,05 test NO paramtricos

Los test de normalidad ensayados dan un valor de p significativo (p <0,05) en ambos


grupos culturales. Por tanto hay evidencias suficientes para rechazar la hiptesis nula de
normalidad de la variable reduccin del peso en ambas muestras. NO PODEMOS USAR
TEST PARAMTRICOS.

C aptulo 8

Cualitativa dicotmica versus cuantitativa


PARAMTRICOS

NO PARAMTRICOS

2 GRUPOS

U de Mann-Whitney

Independientes

T de Student para muestras independientes

Aparejados

T de Student para muestras apareadas

Wilcoxon

Variable predictora Cualitativa versus variable resultado Cuantitativa.

Pgina 779

C aptulo 8

Pgina 780

Pregunta de investigacin
Existen diferencias de la tensin arterial sistlica (TAS) de los 20
alumnos del curso de Metodologa de investigacin en funcin del
sexo?
Variable PREDICTORA
Cualitativa dicotmica
Sexo

Variable RESULTADO
Cuantitativa
TAS

Cul es el test estadstico ms adecuado?

C aptulo 8

Test de la U de Mann-Whitney
Condiciones de aplicacin:
- Si alguna de las dos muestras contiene menos de 30 observaciones y No se puede
asumir la normalidad.
- Variable medida en escala ORDINAL.
- Si la muestra es de muy pequeo tamao (<10 observaciones en alguno de los dos
grupos).
Inconvenientes:
- Se pierde potencia para detectar diferencias significativas (para una comparacin que
resulte significativa con 95 individuos en la t de Student, se necesitaran 100 individuos
para que la misma comparacin resulte significativa con el test de Mann-Whitney).
- No permite construir intervalos de confianza.

Pgina 781

C aptulo 8

Alumnos

TAS
Alumnos

Rango 1
(R1)

Orden

Alumnas

TAS
Alumnas

Rango 2
(R2)

Orden

110

9,5

90

120

16

15

95

2,5

100

110

9,5

115

13,5

13

110

9,5

10

110

9,5

120

16

17

100

115

13,5

14

120

16

16

110

9,5

11

125

18,5

18

100

125

18,5

19

95

2,5

10

125

20

20

10

100

9,5

12

10

Total

10

78,5

Hiptesis nula Ho: La TAS es igual en alumnos y en alumnas.


Hiptesis alternativa Ha: La TAS es diferente en alumnos y en alumnas.

Pgina 782

C aptulo 8

U de Mann-Whitney

rea de
rechazo

Ha

Area de NO
rechazo

Hiptesis nula

rea de
rechazo

Ha

Los valores de estadstico U y W calculados por el test se comparan con los tabulados para un contraste
bilateral con un error alfa 0,05.

Pgina 783

C aptulo 8

Pgina 784

U de Mann-Whitney
TAS

SEXO

Mean Rank

Sum of Ranks

Alumna

10

7,85

78,50

Alumno

10

13,15

131,50

Total

20

Test estadsticos

TAS

Mann-Whitney U

23,50

Wilcoxon W

78,50

Zu

- 2,030

Significacin a dos colas

0,041

Significacin exacta a una cola

0,043

Mean rank
Zu

Sum of ranks

=
U-R

El ranking promedio de la TAS en mujeres es 7,85 y en los hombres 13,15, es decir existen
diferencias entre alumnos y alumnas, y por tanto como p < 0,05 se rechaza la Ho.
Conclusin: La TAS es diferente en alumnos y en alumnas, siendo mayor en varones.

C aptulo 8

Pgina 785

Ejemplo para muestras pequeas

- Un profesor de bioestadstica utiliza dos tipos de modelos de cursos para


ensear la misma materia a un grupo de 10 alumnos mdicos con un nivel
previo similar de conocimientos en bioestadstica. El experimentador quiere
demostrar que el procedimiento clsico de asistencia a clase (PRESENCIAL)
es ms efectivo que el curso online (a DISTANCIA) que le propone la
direccin que presupone que es ms eficiente; para ello, mide el nivel de
conocimientos adquiridos por los alumnos en bioestadstica en ambos
modelos de curso mediante el mismo examen de conocimientos realizado al
final de cada tipo de curso.
- El plan experimental preliminar consiste en elegir al azar tanto una muestra
total de 10 mdicos, 5 para cada mtodo.

C aptulo 8

Pgina 786

Planteamiento de la hiptesis

- Hiptesis nula (Ho). Las diferencias observadas entre las calificaciones del
examen de conocimientos mediante los dos tipos de cursos se deben al azar.
- Hiptesis alternativa (Ha). Las calificaciones del examen de conocimientos,
segn el mtodo de enseanza PRESENCIAL son ms altas y diferentes que
las observadas en el mtodo A DISTANCIA.
Cul es la prueba estadstica ms adecuada?

C aptulo 8

Tipo de Curso

Calificaciones de los alumnos

N del alumno

A DISTANCIA

80

85

25

70

90

Tipo de Curso

Calificaciones de los alumnos

N del alumno

10

PRESENCIAL

95

100

93

110

45

- Nivel de significacin: Para todo valor de probabilidad igual o menor que p = 0,05, se
acepta Ha y se rechaza Ho.
- Zona de rechazo: Para todo valor de probabilidad mayor que 0,05, se acepta Ho y se
rechaza Ha.
- Dos cursos diferentes aplicados en dos grupos de alumnos mdicos.

Pgina 787

C aptulo 8

Test de la U de Mann-Whitney (paso 1)


- Aplicacin de la prueba estadstica.
De acuerdo con los pasos, las observaciones se deben ordenar en rangos del
menor al mayor.
- Rangos de lectura de la tabla anterior.

Tipo de Curso

Calificaciones de los alumnos

R (S)

A distancia Grupo 1

80 (4)

85 (5)

25 (1)

70 (3)

90 (6)

19

Presencial Grupo 2

95 (8)

100 (9)

93 (7)

110 (10)

45 (2)

36

Pgina 788

C aptulo 8

Test de la U de Mann-Whitney (paso 2)


Calculamos las U de Mann-Whitney (U1 y U2) con las siguientes frmulas:

Pgina 789

C aptulo 8

Test de la U de Mann-Whitney (paso 2)


Calculamos las U de Mann-Whitney (U1 y U2)

Pgina 790

C aptulo 8

Test de la U de Mann-Whitney (paso 3)


- De los dos valores de U calculados (U1 y U2), se elige el valor ms pequeo (U2
= 4) y se comparan con los valores tabulados crticos de la U Mann-Whitney
- En caso de que el valor de U calculado no se localice en las tablas
correspondientes, se obtendr de la frmula siguiente;
Ucalculado = [ n1 * n2 ] - U
Ucalculado = [ 5 * 5 ] 21 = 4
- En esta frmula, U corresponde al valor ms alto (U1 = 21) . El resultado en
ambos casos es el mismo (4).

Pgina 791

C aptulo 8

Tamao
muestral

Ucalculado =

p = 0,048

Pgina 792

C aptulo 8

Decisin
A la probabilidad del valor U de Mann-Whitney, calculado anteriormente (Ucalculado),
corresponde a un valor de la p de 0,048, el cual es ms pequeo que el nivel de
significancia (0,05); por lo tanto, se acepta Ha y se rechaza Ho.

Pgina 793

C aptulo 8

Interpretacin
Entre las calificaciones del examen de conocimientos adquiridos mediante las dos
modalidades del curso de enseanza de la bioestadstica, existe una diferencia
significativa con un nivel de probabilidad de error alfa menor del 5% (p<0,05); es
decir, aun cuando las muestras de ambos grupos son pequeas, las calificaciones
ms altas mediante el curso clsico PRESENCIAL sealan ms efectividad, con
la probabilidad de equivocarse de 0,048 para aceptarlo por la influencia del AZAR
(4,8%).

Pgina 794

C aptulo 8

Pgina 795

Ejemplo aplicable cuando la muestra es mayor de 25 y donde


n1 y n2 pueden ser iguales o de un tamao diferente:
El Profesor del curso de Bioestadstica aplicada para mdicos, entusiasmado
por las observaciones y conclusiones preliminares, decide repetir el experimento
aumentando el tamao muestral en ambos grupos. Disea un nuevo estudio con 10
alumnos mdicos que realizan el curso con el mtodo a DISTANCIA y 25 mdicos
mediante el procedimiento clsico PRESENCIAL. Los nuevos datos del estudio se
muestran en la tabla siguiente.

C aptulo 8

Planteamiento de la hiptesis
- Hiptesis nula (Ho). Las posibles diferencias entre las calificaciones dadas por
los alumnos en ambos tipos de cursos se deben al azar.
- Hiptesis alternativa (Ha). Las calificaciones de los alumnos inscritos en el curso
realizado por el mtodo clsico PRESENCIAL, propuesto por el experimentador,
son diferentes y con valores ms altos.
- Nivel de significacin: Para todo valor de probabilidad igual o menor que 0,05,
se acepta Ha y se rechaza Ho.
- Zona de rechazo: Para todo valor de probabilidad mayor que 0,05, se acepta Ho
y se rechaza Ha.

Pgina 796

Pgina 797

C aptulo 8

Poblacin de alumnos mdicos a los cuales se les aplic dos


tipos de cursos (mtodo presencial, mtodo a distancia)
Curso PRESENCIAL N=25
PRESENCI
AL

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

Notas

55

70

90

110

45

60

60

75

80

95

100

110

95

60

70

80

40

65

50

75

90

90

100

80

100

Curso a DISTANCIA (online) N=10


DISTANCIA N=10

10

Notas

60

80

25

30

40

60

90

100

60

55

Cul es la prueba estadstica ms adecuada?

C aptulo 8

Test de la U de Mann-Whitney (paso 1)


- Aplicacin de la prueba estadstica. Primero ordenamos los rangos de todas las
observaciones.
- Direccin de las ligas o empates y el tamao de estas.

Pgina 798

C aptulo 8

Pgina 799

C aptulo 8

Test de la U de Mann-Whitney (paso 2)


Calculamos las U de Mann-Whitney (U1 y U2)

Pgina 800

C aptulo 8

Test de la U de Mann-Whitney (paso 3)


Teniendo en cuenta los pasos del test, hay que saber que cuando el tamao
muestral total es mayor de 25 (como ocurre en este caso), el estadstico del
test de Mann-Whitney se distribuye normalmente, por tanto se calcula el
estadstico Z, que se compara con el tabulado para conocer la probabilidad
(p). Esto se calcula como sigue:

Z=

_
U- U

Pgina 801

C aptulo 8

Test de la U de Mann-Whitney (paso 3a)


Donde:
Z = valor estadstico de la curva normal.
U = cualquier valor de U calculado (ya sea U1 o U2).
U = valor promedio de U.
U = desviacin estndar de U.
Calculamos el valor promedio de U:

_
U=

n1 * n2
2

U=

10 * 25
2

= 125

Pgina 802

C aptulo 8

Test de la U de Mann-Whitney (paso 3b)


- La desviacin estndar de U (U ) se determina de la forma siguiente:
- Donde:
U = desviacin estndar de U.
n1 y n2 = tamao de la muestra de los grupos 1 y 2.
N = tamao total de la muestra (la suma de n1 y n2).
Li = sumatoria de las ligas o empates.
El clculo de Li se realiza de la siguiente manera:

Li =

Pgina 803

C aptulo 8

Z=
Li =

_
U- U

U=

U =

n1 * n2
2

Pgina 804

C aptulo 8

Test de la U de Mann-Whitney (paso 3c)


- Una vez obtenida la sumatoria de Li, se determinar la desviacin estndar de U
(U ) mediante la expresin siguiente:

U =

U =

U = 27,24

Pgina 805

C aptulo 8

Test de la U de Mann-Whitney (paso 3d)


- Una vez calculados todos los parmetros necesarios, se obtiene el valor Z
conforme la frmula anterior:

Z=

_
U- U

Z=

178 - 125
27,24
72

- 125

27,24

U = cualquier valor de U calculado (ya sea U1 o U2).

= 1,95
= - 1,95

Pgina 806

C aptulo 8

Test de la U de Mann-Whitney (paso 4)


- Para obtener la probabilidad (valor de la p) del valor Zcalculado de 1.95 (1,9 +
0,05), se debe consultar la tabla de tamao de la muestra en funcin de los
valores d y buscar la hilera 1.9, en cuya columna correspondiente al error alfa de
0,05 se localiza el nmero 0,9788, cuyo complementario (1 - 0,9744 = 0,0256)
corresponde a la probabilidad del valor de U con respecto al promedio (p =
0,0256). Esto quiere decir que es menor que el nivel de significancia (p<0,05).

Pgina 807

C aptulo 8

p = [ 1 - 0,9744 ] = 0,0256

Pgina 808

C aptulo 8

Pgina 809

Decisin
A la cifra de Z de 1,95 le corresponde una probabilidad menor que 0,05 (p = 0,0256),
por lo cual se acepta Ha y se rechaza Ho (tabla de probabilidades asociadas en
valores extremos como los de 2 en la distribucin normal).

C aptulo 8

Pgina 810

Interpretacin
El experimentador (profesor de bioestadstica de los cursos), al aumentar el tamao
muestral en ambos grupos (n1=10, y n2=25, N=35), CONFIRMA la investigacin
preliminar con una muestra pequea (n1=5, y n2=5, N=10), con lo cual da a
entender que los resultados (calificaciones de los alumnos) logrados con el mtodo
PRESENCIAL son diferentes de los obtenidos con el mtodo de enseanza A
DISTANCIA; adems, este ltimo revela calificaciones ms bajas y permitira concluir
que es menos efectivo que el otro.

C aptulo 8

Pgina 811

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los niveles
de anticuerpos frente al virus de la Rubeola en la poblacin gestante
inmunizada de Ceuta en el ao 2010?
Variable PREDICTORA
Cualitativa dicotmica
Cristianas inmunizadas
Musulmanas inmunizadas

Variable RESULTADO
Cuantitativa continua
Virus de la Rubeola

Cul es el test estadstico ms adecuado?

C aptulo 8

Anti-IgGRUBEOLA

SEXO

Mean Rank

Sum of Ranks

Cristianas

234

392,46

91836,0

Musulmanas

487

345,88

168445,0

Total

721

Test estadsticos

IgG-Rubeola

Mann-Whitney U

49573,00

Wilcoxon W

168401,0

Zu

- 2,828

Significacin a dos colas (bilateral)

0,005

Significacin exacta a una cola

0,043

Mean rank
Zu

Sum of ranks

=
U-R

El ranking promedio de los niveles de Anti-IgG-RUBEOLA en gestantes inmunizadas


cristianas superior al de las musulmanas, es decir existen diferencias significativas entre
ambos grupos culturales, y por tanto como p < 0,05 se rechaza la Ho.
Conclusin: El grado de inmunizacin frente a la rubeola es diferente en cristianas y
musulmanas, siendo mayor en las primeras.

Pgina 812

C aptulo 8

Pgina 813

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los niveles de
anticuerpos frente a Toxoplasma en la poblacin gestante inmunizada
de Ceuta en el ao 2010?
Variable PREDICTORA
Cualitativa dicotmica
Cristianas inmunizadas
Musulmanas inmunizadas

Variable RESULTADO
Cuantitativa continua
Toxoplasma

Cul es el test estadstico ms adecuado?

C aptulo 8

Test de normalidad

Test de Kolmogorov-Smirnov

Ao 2010

Media

DE

Estadstico Z

Significacin

Niveles de anticuerpos IgG


anti-toxoplasma

297

77,5

133,6

5,321

0,000

Test de normalidad

Test de Kolmogorov-Smirnov

Ao 2010

Tipo de cultura

Media

DE

Estadstico Z

Significacin

Niveles de
anticuerpos
IgG antitoxoplasma

Cristianas

32

67,9

58,6

1,260

0,084

Musulmanas

265

78,62

139,9

5,110

0,000

Ho: p > 0,05 test paramtricos

Pgina 814

Ha: p < 0,05 test NO paramtricos

Los test de normalidad ensayados dan un valor de p significativo (p <0,05) en ambos


grupos culturales. Por tanto hay evidencias suficientes para rechazar la hiptesis nula de
normalidad de la variable reduccin del peso en ambas muestras. NO PODEMOS USAR
TEST PARAMTRICOS.

C aptulo 8

Anti-IgGtoxoplasma

SEXO

Mean Rank

Sum of Ranks

Cristianas

32

162,11

5187,50

Musulmanas

265

147,42

39065,50

Total

297

Test estadsticos

IgG-toxoplasma

Mann-Whitney U

3820,50

Wilcoxon W

39065,50

Zu

- 0,914

Significacin a dos colas (bilateral)

0,361

Mean rank
Zu

Pgina 815

Sum of ranks

=
U-R

El ranking promedio de los niveles de Anti-IgG-toxoplasma en gestantes inmunizadas


cristianas similar al de las musulmanas, es decir NO existen diferencias significativas entre
ambos grupos culturales, y por tanto como p > 0,05 se acepta la Ho (igualdad).
Conclusin: El grado de inmunizacin (nivel de anticuerpos especficos) frente a
Toxoplasma es igual cristianas y musulmanas.

C aptulo 8

Cualitativa dicotmica versus cuantitativa


PARAMTRICOS

NO PARAMTRICOS

2 GRUPOS

U de Mann-Whitney

Independientes

T de Student para muestras independientes

Aparejados

T de Student para datos


apareados

Wilcoxon

Variable predictora Cualitativa versus variable resultado Cuantitativa.

Pgina 816

C aptulo 8

Variables cuantitativas:
Comparacin de la media entre dos grupos
Muestras independientes
Tipos de dieta

Peso (Kg)

Pescado

23

Pescado

19

Pescado

28

Pescado

23

Pescado

Pescado

17

Pescado

14

Pescado

13

.
Huevos

21

Huevos

22

Huevos

26

Huevos

25

Huevos

Huevos

28

Huevos

17

Huevos

Huevos

12

Muestras relacionadas
Peso inicial

Peso final (Kg)

DIF

23

21

-2

19

22

+3

28

26

-2

23

25

+2

-3

17

28

+ 11

14

17

+3

13

-9

..

Se compara cada individuo consigo mismo antes y despus de un tratamiento con una
determinada dieta.

Pgina 817

C aptulo 8

Pgina 818

Test de la t de Student para datos apareados (muestras


relacionadas)
Caractersticas del test:
- Se realizan mediciones repetidas en un mismo individuo.
- Se aplican dos frmacos consecutivos a un mismo paciente.
- Se desea evaluar el cambio de una variable cuantitativa tras aplicar un
tratamiento (cambio entre antes y despus).
- Calcular una nueva variable que es la diferencia entre los valores antes
y despus de cada individuo.
- Cuando el tamao muestral es inferior al 30, se debe probar si la nueva
variable sigue una distribucin normal.
- En las muestras relacionadas la variabilidad ALEATORIA es menor que en
las muestras independientes.

C aptulo 8

Test de la t de Student para muestras relacionadas


Pregunta de investigacin: Existen variacin del peso de la madre antes y
despus del embarazo?
Hiptesis nula Ho X antes = X despus ( DIF = POST FREC = 0)
Hiptesis alternativa Ha X antes X despus ( DIF = POST FREC 0)

t calculada =

d - O

S2
n

Variables
Estadsticos

Peso antes del


embarazo

Peso despus del


parto

Diferencia de peso

Media

54,26

55,64

1,38

Desviacin estndar (S)

6,653

7,624

4,096

1626

1626

1626

Pgina 819

C aptulo 8

Media

Desviacin
estndar (s)

Error estndar de
la media (EEM)

Peso ANTES
embarazo

54,26

1626

6,653

0,165

Peso DESPUS
del parto

55,64

1626

7,624

0,189

Variables

Variable

Correlacin (r)

Significacin

Peso ANTES embarazo versus Peso


DESPUS del parto

1626

0,844

0,000

Variables

Diferencias relacionadas Intervalo de


confianza de la
diferencia

t calculada

gl

Media

13,562

1625 0,000

Peso despus del 1,378


parto peso antes
del embarazo

EEM

Inferior

Superior

4,096

0,102

1,178

1,577

t calculada= 13,56 > t tabulado = 1,96;


tcalculada > ttabulada

Significacin
bilateral

p < 0,001

p < 0,05 (rechazamos la hiptesis nula)

Ha: Existe variacin en el peso de las madres antes y despus de un embarazo.

Pgina 820

C aptulo 8

Distribucin de la t de Student (gl 30)


El test de la T de Student para muestras de ms de 30 individuos presenta
una distribucin muy similar a la distribucin normal tipificada Z.
El test de la T de Student es una prueba BILATERAL, y por tanto NO
especifica la direccin de la diferencia ( A B).
Nivel de significacin
estadstica = 0,05

t calculada = 6,666

Z 1- /2

Z 1- /2

- 1,96

1,96

t tabulado = 1,96 para los grados de libertad de la muestra (1620)

Pgina 821

C aptulo 8

Pgina 822

Test de la t de Student para datos apareados (muestras


relacionadas)
Ejemplo
Estudio sobre la forma fsica de un grupo de 30 individuos antes y despus
de un programa de entrenamiento deportivo (PED).
Pregunta de investigacin:
Ha mejorado la forma fsica del grupo durante las sesiones del PED?
Reduce el PED la frecuencia cardiaca media?
Variable PREDICTORA
Cualitativa dicotmica
PED

Variable RESULTADO
Cuantitativa
Frecuencia Cardaca Media

C aptulo 8

Pgina 823

Objetivo: Conocer si el entrenamiento deportivo (PED) mejora la forma fsica


de un grupo de individuos.
Material: Grupo de 30 individuos antes y despus de un programa de
entrenamiento deportivo (PED)
Mtodo: Se evala la frecuencia cardiaca antes (FRECPRE) y despus del
PED (FRECPOST).

Se define una nueva variable DIF = FRECPRE FRECPOST.


Hiptesis nula Ho X antes = X despus
( DIF = FRECPRE FRECPOST =
Hiptesis alternativa H1 X antes X despus
(DIF = FRECPRE FRECPOST 0)

C aptulo 8

Resultados
Variables

Media

Desviacin
estndar (s)

Error estndar de
la media (EEM)

FRECPRE

79,53

30

19,15

3,50

FRECPOST

70,40

30

12,95

2,36

Variables

Correlacin (r)

Significacin

FRECPRE versus FRECPOST

30

0,828

0,000

Variables

FRECPRE FRECPOST

Diferencias
relacionadas
Media

EEM

9,13

11,12 2,031

Intervalo de
confianza de la
diferencia

t calculada

gl

Significacin
bilateral

Inferior

Superior

4,49

29

0,000

4,98

13,29

t calculada < t tabulada

p>0,05 (aceptamos la Ho)

t calculada > t tabulada

p<0,05 (rechazamos la hiptesis nula)

Pgina 824

C aptulo 8

Test de la t de Student para datos apareados (muestras


relacionadas)
Ejemplo - Conclusiones
1. Puede concluirse que ha existido un descenso significativo (p<0,001)
de la frecuencia cardiaca despus del PED. Existen evidencias, con una
confianza del 95%, para afirmar que el PED se ha acompaado de un
descenso de la frecuencia cardaca .
2. El descenso medio estimado fue de 9 latidos por minuto despus del
PED.

Pgina 825

C aptulo 8

Pgina 826

Mito 1: La sonrisa de la esfinge


La t de Student de datos apareados es un test paramtrico, es decir para
usarlo se debe cumplir la normalidad de la variable cuantitativa.
Se cumple? La nueva variable DIF = FRECPRE FRECPOST sigue una
distribucin normal?
He observado en tus resultados de DIF un valor de la desviacin tpica (11,1)
muy superior a la media (9,1),
Cmo justificas esa supuesta normalidad? Qu test has empleado para
comprobar esa supuesta normalidad?
La frecuencia cardiaca es una variable cuantitativa DISCRETA.
Por qu empleas un test paramtrico para este tipo de variables?No sera
ms adecuado utilizar el test de WILCOXON?

C aptulo 8

Objetivo: Comprobar si la reduccin ponderal conseguida tras intervencin


diettica en los pacientes con obesidad mrbida disminuye los factores de
riesgo cardiovascular.
Prueba de la t de Student para datos apareados
Prueba de Shapiro-Wilk (test de normalidad)
IMC > 40
Inicio

Final

IC (95%)

Peso (Kg)

149,1 (22)

115 (18)

< 0,001

26,9-39,8

IMC (Kg/m2)

49,2 (7,7)

38,8 (5)

< 0,001

7,8-13,2

Cintura (cm)

144,4 (17,3)

119,6 (12,1)

< 0,001

18,4-36,5

Cadera (cm)

143,3 (17,5)

127,7 (14,6)

0,02

9,1-24,1

Indice C/c

1,01 (0,12)

0,94 (0,08)

0,02

0,017-0,16

Los valores se expresan como media (desviacin estndar); p nivel de significacin; IC intervalo de
confianza; IMC: ndice de masa corporal; C/c cintura-cadera.

Pgina 827

C aptulo 8

Objetivo: Comprobar si la reduccin ponderal conseguida tras intervencin


diettica en los pacientes con obesidad mrbida disminuye los factores de
riesgo cardiovascular.
Prueba de la t de Student para datos apareados
IMC > 40

Inicio

Final

IC (95%)

Peso (Kg)

126 (19)

107 (18)

< 0,001

13,5-20,3

IMC (Kg/m2)

48,7 (5,8)

42,5 (6,2)

< 0,001

4,5-7,5

Cintura (cm)

129,8 (17,7)

118,7 (15,4)

< 0,001

9,1-21,6

Cadera (cm)

142,5 (15,6)

132,8 (13)

0,003

3,6-15,9

ndice C/c

0,92 (0,11)

0,89 (0,09)

0,04

0,017-0,16

Los valores se expresan como media (desviacin estndar); p nivel de significacin; IC intervalo de
confianza; IMC: ndice de masa corporal; C/c cintura-cadera

Pgina 828

C aptulo 8

La reduccin ponderal se acompa de una mejora del perfil lipdico


(triglicridos, cHDL y apoprotena B100 principalmente en los varones.
Varones

Final

IC (95%)

Colesterol total (mg/dl) 192 (49,7)

179,7 (34,5)

0,16

-5,1 a 29,6

Triglicridos (mg/dl)

162,4 (73,6)

107,7 (33,7)

0,001

25,4 - 90,0

cLDL (mg/dl)

124,1 (38,5)

115 (30,4)

0,12

-12,9 a 5,7

cHDL (mg/dl)

35,4 (86,3)

43,5 (8,5)

< 0,001

5,7 12,6

cVLDL (mg/dl)

32,5 (14,7)

21,9 (6,8)

0,002

4,8 18,5

Apo B100 (mg/dl)

122,1 (31,3)

100,7 (19,6)

0,01

6,5 40,5

117,8 (13,2)

126 (18,8)

0,24

- 17,5 a 4,9

Apo A1 (mg/dl)

Inicio

Los valores se expresan como media (desviacin estndar); p nivel de significacin; IC intervalo de
confianza;

Pgina 829

C aptulo 8

La reduccin ponderal se acompa de una mejora del perfil lipdico


(triglicridos, cHDL y apoprotena B100 principalmente en los varones.
Mujeres

Final

IC (95%)

Colesterol total (mg/dl) 189 (29,2)

183,6 (32)

0,32

-5,7 a 16,5

Triglicridos (mg/dl)

137 (60,8)

109,5 (43,7)

0,22

-5,8 a 23,5

cLDL (mg/dl)

117,8 (13,2)

115,6 (26,4)

0,07

-0,8 a 18,5

cHDL (mg/dl)

41,9 (15,6)

45,6 (13.1)

0,03

0,4 6,6

cVLDL (mg/dl)

32,3 (15,9)

22 (8,4)

0,2

-1,1 a 4,8

Apo B100 (mg/dl)

110 (30,6)

106,1 (20,6)

0,7

-11,4 a 15,9

124,1 (23,2)

129 (21,4)

0,052

-0,07 a 19,4

Apo A1 (mg/dl)

Inicio

Los valores se expresan como media (desviacin estndar); p nivel de significacin; IC intervalo de
confianza;

Pgina 830

C aptulo 8

Pgina 831

Discusin - Conclusiones
- Los varones presentaron una mayor reduccin ponderal que las mujeres.
- Con la intervencin diettica empleada conseguimos una mejora en el perfil
aterognico, principalmente en los triglicridos, VLDL y HDL.
- Los varones presentaron una mejora ms importante que las mujeres en el
perfil lipdico.
- La reduccin ponderal ha conseguido una reduccin de algunos de los
factores de riesgo cardiovascular (FRCV) analizados.
- El sexo masculino presenta una mejor respuesta global con reduccin de los
FRCV y mejora de la distribucin grasa.

C aptulo 8

Pgina 832

Mito 1: La sonrisa de la esfinge

La t de Student de datos apareados es un test paramtrico, es decir para


usarlo se debe cumplir la normalidad de las variables cuantitativas.
Se cumple en todas las variables? Las nuevas variables DIF = FRECPRE
FRECPOST siguen una distribucin normal? Cmo justificas esa supuesta
normalidad?Que test has empleado?
He observado que en tus resultados NO aparece las nuevas variables DIF ni
su desviacin tpica.
Porqu no se ha incluido en los resultados?

C aptulo 8

Cualitativa versus cuantitativa


PARAMTRICOS

NO PARAMTRICOS

U de Mann-Whitney

Independientes

T de Student para muestras independientes

Aparejados

T de Student para muestras apareadas

Wilcoxon

Variable predictora Cualitativa versus variable resultado Cuantitativa.

Pgina 833

C aptulo 8

Test de Wilcoxon

Prueba NO PARAMTRICA o de libre distribucin


- No se basa en la media, desviacin estndar, etc.
Condiciones de aplicacin:
- Diseo emparejado o de medidas repetidas
- Datos a comparar son
ORDINALES o
Cuantitativos con BAJO tamao muestral (n < 30) y
NO siguen una distribucin NORMAL

Pgina 834

C aptulo 8

Pgina 835

Ejemplo (muestras relacionadas)


Test de Wilcoxon para datos apareados
Estudio sobre la mejora clnica del dolor en pacientes con artrosis tratados
con un infiltracin de corticoides.
Pregunta de investigacin:
Ha mejorado el grado de bienestar de los pacientes con artrosis tras el
tratamiento con infiltraciones?
Existen evidencias de una mejora en el nivel de dolor en los pacientes con
artrosis despus del tratamiento con infiltraciones intrarticulares?
Nivel de dolor ANTES
del tratamiento

Infiltracin

Nivel de dolor DESPUS


del tratamiento

C aptulo 8

Pgina 836

Objetivo: Conocer si la infiltracin con corticoides mejora el bienestar clnico


de en un grupo de los pacientes con artrosis de rodilla...
Material: Grupo de pacientes con artrosis de rodilla del Hospital X
seleccionados para el ensayo.
Mtodo: Se evala el nivel de dolor en los pacientes mediante un test
estandarizado antes (NDA) y despus del tratamiento infiltrativo (NDD). Se
define una nueva variable DIF = NDA NDD.
Hiptesis nula Ho

X antes = X despus

( DIF = NDA NDD = 0)

Ho (hiptesis nula) = La infiltracin con corticoides NO mejora el bienestar


clnico de los pacientes con artrosis de rodilla.
Hiptesis alternativa H1 X antes X despus (DIF = NDA NDD 0)
Ha (hiptesis alternativa) = La infiltracin con corticoides SI mejora el
bienestar clnico de los pacientes con artrosis de rodilla.

C aptulo 8

Pgina 837

Test de 2 de tendencia lineal


Ejercicio: Realizamos un estudio hipottico de cohortes recogiendo datos
sobre la actividad deportiva que practicaban en su juventud 10 pareja de
gemelos de Ceuta, donde despus de un seguimiento de 20 aos, uno de los
gemelos ha muerto y el otro sobrevive.
Variable predictora:
Actividad deportiva
Variable cuantitativa ordinal
S= sedentarios
O= deporte ocasional
R= deporte regular
C = deporte competitivo
E = deporte de elite

Variable resultado:
Pareja

Gemelo vivo

Gemelo muerto

10

C aptulo 8

Pgina 838

Test de Wilcoxon para datos apareados


Ejercicio: Realizamos un estudio hipottico de cohortes recogiendo datos
sobre la actividad deportiva que practicaban en su juventud 10 pareja de
gemelos de Ceuta, donde despus de un seguimiento de 20 aos, uno de los
gemelos ha muerto y el otro sobrevive.
Variable predictora:
Actividad deportiva
Variable cuantitativa ordinal
0 = sedentarios
1= deporte espordico
2= deporte regular
3= deporte competitivo
4= deporte de lite

Variable resultado:
Pareja

Gemelo vivo

Gemelo muerto

10

C aptulo 8

Prueba de los rangos con signo de WILCOXON


para datos apareados
Estadstico de contraste

DESENLACE - TIPO DE DEPORTE

- 1,897

Significacin asintomtica (bilateral)

0,058

Prueba de los signos para datos apareados


Estadstico de contraste

DESENLACE - TIPO DE DEPORTE

Significacin asintomtica (bilateral)

0,180

Pgina 839

C aptulo 8

El test de Wilcoxon es una prueba BILATERAL, y por tanto NO especifica


la direccin de la diferencia ( A B).

Nivel de significacin
estadstica ( = 0,05)

Z calculado= - 1,89

Ho
Z 1- /2

Z 1- /2

Ha

Ha

- 1,96
Z calculado= - 1,89

1,96
<

Z tabulado = 1,96

Pgina 840

C aptulo 8

Pgina 841

Ho = La prctica deportiva en la juventud NO reduce la mortalidad


Ha = La prctica deportiva en la juventud REDUCE la mortalidad

z=

n(n + 1)
4
~ N (0,1)
n(n + 1)(2n + 1)
24
W-

z=

n(n + 1)
4
~ N (0,1)
n(n + 1)(2n + 1) g t i3 - t i
-
24
2
i =1
W-

1. Calculo del estadstico z: Zcalculado= -1,89


2. Comparacin del Zcalculado con el Ztabulado de las tablas de la normal. Zcalculado= -1,89 < Ztabulado = -1,96 para
p < 0,05 a dos colas. La significacin estadstica p = 0,058
3. No se dispone de evidencias para rechazar la Ho de igualdad de medias entre el gemelo que sobrevivi y
el que muri. La probabilidad de hallar unas diferencias al menos como las encontradas es de slo el 5,8%.
Las diferencias encontradas pueden ser debidas al AZAR.
4. No se puede rechazar Ho, ya que el valor de p es superior a 0,05. Estos datos NO proporcionan
evidencias que indiquen que la prctica deportiva era superior en los gemelos supervivientes respecto a
sus hermanos gemelos fallecidos. El estudio NO apoya que el deporte en la juventud reduzca la mortalidad
en el futuro.
5. ERROR de DISEO: falta de potencia estadstica por su escaso tamao muestral. ERROR BETA.

C aptulo 8

Pgina 842

Desenlace (E) Variable resultado


Exposicin (F) Variable predictora

Muerte

Sobreviviente

Sedentarismo (+)

Sedentarismo (-)

A: Fallecidos con sedentarismo


B: Sobrevivientes sedentarios
C: Fallecidos deportistas
D: Sobrevivientes deportistas

RR =

[ A / (A + B)]
[ C / (C + D) ]

Es la probabilidad de morir (E) en el grupo de sedentarios (expuestos al factor


de riesgo) en relacin con la probabilidad de muerte en deportistas (grupo no
expuesto).

C aptulo 8

RR = 1.41 IC95%=1.23-1.61 de los sedentarios frente a los para los ocasionalmente


activos
RR = 1.52 IC95%=1.06-2.17 de los sedentarios frente a los entrenados
Prdidas de
seguimiento
EXPUESTOS al
factor de riesgo
(sedentarismo)

NO expuestos al
factor de riesgo
(sedentarismo)

Seguimiento
20 aos

RIESGO
RELATIVO

Fallecimientos
Sobrevivientes
Fallecimientos
Sobrevivientes

Prdidas de
seguimiento

Kumala et al. Relationship of leisure-time physical activity and mortality: the Finnish twin cohort. JAMA
1998; 11; 279: 440-4.

Pgina 843

C aptulo 8

Pgina 844

Desenlace (E) Variable resultado


Exposicin (F) Variable predictora

Muerte

Sobreviviente

Deporte (+)

Deporte (-)

A: Fallecidos con sedentarismo


B: Sobrevivientes sedentarios
C: Fallecidos deportistas
D: Sobrevivientes deportistas

RR =

[ A / (A + B)]
[ C / (C + D) ]

Es la probabilidad de morir (E) en el grupo de deportistas (expuestos al factor


de proteccin) en relacin con la probabilidad de muerte en sedentarios
(grupo no expuestos).

C aptulo 8

RR = 0.71 IC95%=0.62-0.81 para los ocasionalmente activos


RR = 0.66 IC95%=0.46-0.94 para los entrenados
Prdidas de
seguimiento
EXPUESTOS al
factor de riesgo
(sedentarismo)

NO expuestos al
factor de riesgo
(sedentarismo)

Seguimiento
20 aos

RIESGO
RELATIVO

Fallecimientos
Sobrevivientes
Fallecimientos
Sobrevivientes

Prdidas de
seguimiento

Kumala et al. Relationship of leisure-time physical activity and mortality: the Finnish twin cohort. JAMA
1998; 11; 279: 440-4.

Pgina 845

C aptulo 8

Pgina 846

- Diseo: estudio de COHORTES


- 7925 varones gemelos
- 7977 mujeres gemelas
- Resultados:
- RR = 0,71: Se encontr una reduccin del 29% en la mortalidad para los
ocasionalmente activos comparados con los sedentarios.
- RR = 0,66: Se encontr una reduccin del 34% en la mortalidad para los entrenados
comparados con los sedentarios.
RRR = [ 1 RR ] * 100

RRR1 = 29%

RRR2 = 34%

- Conclusiones: Este estudio es importante porque deja claro que la mejor superviviencia
de los ms activos NO se debe a una predisposicin gentica (controlada por el
emparejamiento entre gemelos), sino al efecto real del ejercicio fsico sobre la
superviviencia.

Kumala et al. Relationship of leisure-time physical activity and mortality: the Finnish twin cohort. JAMA
1998; 11; 279: 440-4.

C aptulo 8

Pgina 847

Ejemplo (muestras relacionadas)


Estudio sobre los conocimientos adquiridos en Metodologa de Investigacin
en Ciencias de la Salud (MICS) en los alumnos del curso de Sevilla.
Pregunta de investigacin:
Han mejorado los conocimientos adquiridos en Metodologa de Investigacin
en los alumnos del curso de Sevilla?
Aumenta el curso el nivel de conocimientos sobre la materia impartida?
Existen evidencias de una mejora en los conocimientos tericos de
Metodologa de investigacin en los alumnos despus del curso?

Conocimientos de MICS
previos al curso

Curso

Conocimientos de MICS
despus del curso

C aptulo 8

Pgina 848

Objetivo: Conocer si el curso de Metodologa de Investigacin (CMI) realizado en Sevilla


mejora los conocimientos sobre dicha materia en un grupo de alumnos (licenciados en
Ciencias de la Salud).
Material: Grupo de 8 individuos FEA y residentes del Hospital Universitario de Valme
(Sevilla ) antes y despus de realizar el curso de Metodologa de Investigacin en Ciencias
de la Salud (CMICS)
Mtodo: Se evala los conocimientos mediante un test (examen) antes (RCAC) y despus
del CMICS (RCDC). Se define una nueva variable DIF = RCDC RCAC.

Hiptesis nula Ho

X antes = X despus

(DIF = RCDC RCAC = 0)

Ho (hiptesis nula) = La accin formativa (CMICS) no mejora los conocimientos sobre


metodologa de investigacin en los alumnos.

Hiptesis alternativa H1 X antes X despus (DIF = RCDC RCAC 0)


Ha (hiptesis alternativa) = La accin formativa (CMICS) mejora los conocimientos sobre
metodologa de investigacin en los alumnos.

C aptulo 8

Pgina 849

Existen evidencias de una mejora en los conocimientos


tericos de metodologa de investigacin en los alumnos
despus del curso?
N del
Alumno

N respuestas
correctas ANTES del
curso (RCAC)

N respuestas correctas
Diferencia de respuestas
DESPUS del curso (RCDC) acertadas DESPUS ANTES
(RCDC- RCAC)

10

14

14

14

14

13

13

10

13

11

11

Cul es el test estadstico ms acertado?

C aptulo 8

Prueba de los rangos con signo de WILCOXON


para datos apareados
Estadstico de contraste

DESENLACE - TIPO DE DEPORTE

-2,536

Significacin asintomtica (bilateral)

0,011

Prueba de los signos para datos apareados


Estadstico de contraste

DESENLACE - TIPO DE DEPORTE

Significacin asintomtica (bilateral)

0,008

Pgina 850

C aptulo 8

Pgina 851

RESULTADOS: Se realiz la comparacin del Zcalculado con el Ztabulado de


las tablas de la normal mediante el programa estadstico SPSS. El valor del
estadstico Zcalculado = 2,536 fue superior al Ztabulado = 1,96 para p < 0,05 a
dos colas (test de contraste bilateral). La significacin estadstica encontrada
fue de p = 0,011. Estos datos permiten rechazar Ho, ya que el valor de p es
inferior a 0,05.
CONCLUSIONES: Puede concluirse que ha existido un aumento significativo
(p<0,05) del nmero de respuestas acertadas despus del curso. Existen
evidencias, con una confianza del 95% (error alfa del 5%), para afirmar que
la accin formativa ha producido una mejora en los conocimientos. Por
tanto, estos datos proporcionan evidencias que indican una mejora objetiva
y significativa en los conocimientos terico-prcticos de Metodologa de
investigacin en los alumnos despus del curso (hiptesis alternativa).

C aptulo 8

MUESTRAS
APAREADAS

INDEPENDIENTES

n 30

n1 o n2 30

n1 y n2 30

Test de normalidad
Test de levene
Homogeneidad
de las varianzas

Test de la t de
Student para
muestras
independientes

SI

n 30

Test de normalidad
NO

SI

NO

Heterogeneidad
de las varianzas

Test de Welch

Test de la
U de
MannWhitney

Test de la t de
Student para
datos
apareados

Test de
Wilcoxon

Pgina 852

C aptulo 8

Pregunta de investigacin
Qu relacin existe entre los niveles de colesterol-LDL en
sangre y la probabilidad de padecer un IAM?
Variable PREDICTORA
CUANTITATIVA continua
Niveles colesterol-LDL

Variable RESULTADO
CUALITATIVA dicotmica
IAM

Cul es el test estadstico ms acertado?

Pgina 853

C aptulo 8

Pregunta de investigacin
Qu relacin existe entre los niveles de alcoholemia y la
probabilidad de tener un accidente de trfico?
Variable PREDICTORA
CUANTITATIVA continua
Niveles de Alcoholemia

Variable RESULTADO
CUALITATIVA dicotmica
Accidente de trfico

Cul es el test estadstico ms acertado?

Pgina 854

C aptulo 8

Pregunta de investigacin
Qu relacin existe entre la ingesta crnica de alcohol y la
probabilidad de desarrollar cncer de esfago?
Variable PREDICTORA
CUANTITATIVA continua
Ingesta crnica de alcohol

Variable RESULTADO
CUALITATIVA dicotmica
Cncer de esfago

Cul es el test estadstico ms acertado?

Pgina 855

C aptulo 8

Pregunta de investigacin
Qu relacin existe entre la edad gestacional y la
probabilidad de muerte del recin nacido?
Variable PREDICTORA
CUANTITATIVA continua
Edad gestacional

Variable RESULTADO
CUALITATIVA dicotmica
Muerte del RN

Cul es el test estadstico ms acertado?

Pgina 856

C aptulo 8

Depsitos de Fe en mdula sea

Predice
VCM (hemograma)

Produce

Produce
Ferritina (srica)

Predice

Pgina 857

C aptulo 8

Pregunta de investigacin
Qu relacin existe entre el VCM del hemograma y la
probabilidad de tener dficit de los depsitos de hierro en
mdula sea?
Variable PREDICTORA
CUANTITATIVA continua
VCM
(hemograma)

Variable RESULTADO
CUALITATIVA dicotmica
Depsitos de Fe en mdula sea

Cul es el test estadstico ms acertado?

Pgina 858

C aptulo 8

Pregunta de investigacin
Qu relacin existe entre los niveles de ferritina srica y la
probabilidad de tener dficit de los depsitos de hierro en
mdula sea?
Variable PREDICTORA
CUANTITATIVA continua
Ferritina (srica)

Variable RESULTADO
CUALITATIVA dicotmica
Depsitos de Fe en mdula sea

Cul es el test estadstico ms acertado?

Pgina 859

C aptulo 8

Anlisis estadstico
Tipos de test analticos estadsticos de contraste de hiptesis
segn el tipo de variables implicadas en el estudio
Variable dependiente
Variable resultado
Variable
Predictora
Variable
Independiente

Dicotmica

Continua

Dicotmica

Test de 2

t de Student

Continua

Regresin logstica Regresin lineal


simple

Pgina 860

C aptulo 8

Anlisis estadstico

ANLISIS ESTADSTICO
Variable
Predictora
Variable
Independiente

Variable resultado
Dicotmica

Continua

Dicotmica

Test de 2

t de Student

Continua

Regresin logstica

Regresin lineal

REGRESIN LOGSTICA SIMPLE

Pgina 861

C aptulo 8

Anlisis de Regresin Logstica Simple


- Variable RESULTADO: Dicotmica
- Variable PREDICTORA:
- Cuantitativa
- Categrica
Variables PREDICTORAS

Variable RESULTADO

Alcoholemia

Accidente de trfico

Ingesta de alcohol

Cncer de esfago

Colesterolemia

IAM

Edad gestacional

Muerte del RN

Pgina 862

C aptulo 8

Pregunta de investigacin
Qu relacin existe entre los niveles de colesterol-LDL en
sangre y la probabilidad de padecer un IAM?
Variable PREDICTORA
CUANTITATIVA continua
Niveles colesterol-LDL

Variable RESULTADO
CUALITATIVA dicotmica
IAM

Cul es el test estadstico ms acertado?

Pgina 863

C aptulo 8

Modelo de Anlisis de Regresin Logstica Simple

P=

e 1X1
1 + e 1X1

log

P
1-P

= 0 + 1X1

Y
Y=1

Modelo de regresin
logstica simple

Probabilidad de
enfermedad
coronaria

Modelo de probabilidad
lineal simple
Y=0
Factor de riesgo: cLDL

X1

Pgina 864

C aptulo 8

Anlisis de regresin logstica simple

Pgina 865

C aptulo 8

Pregunta de investigacin
Qu relacin existe entre la edad gestacional y la probabilidad de muerte del recin nacido?
Estudio caso-control realizado por Brand et al con 410 RN de edad
gestacional entre 24-29 semanas.
Variable PREDICTORA
CUANTITATIVA continua
Edad gestacional

Anlisis de Regresin Logstica Simple

Variable RESULTADO
CUALITATIVA dicotmica
Probabilidad de morir

Pgina 866

Pgina 867

C aptulo 8

Anlisis de regresin logstica simple


Qu relacin existe entre la edad gestacional y la probabilidad de muerte
del recin nacido?
Variable PREDICTORA
Edad gestacional
Variable RESULTADO
Riesgo de muerte del RN

Edad gestacional
Semanas

24

25

26

27

28

29

Total

Vivo

16

38

49

45

30

181

Muerto

26

56

69

50

21

229

Estimaciones de los parmetros del modelo logstico


propuesto para los datos anteriores
Variable

Estimacin

Error estndar

Constante

18,36

2,375

Edad
gestacional

- 0,6819

0,08908

P = probabilidad que muera un RN

C aptulo 8

Pgina 868

Regresin logstica. Coeficiente de regresin logstica 1


Existe relacin entre la probabilidad de muerte neonatal (Variable Resultado) y la edad
gestacional (Variable Predictora) en los RN de 24-29 semanas?
Z

Valor

Z95%

1,96

95%

2,56

99%

Z99,5%

3,29

99,5%

Z99%

Estimaciones de los parmetros del modelo logstico


propuesto para los datos anteriores

Coeficiente de regresin
logstica estandarizado

1
EE1

0,6819
0,08908

7,65

>

Variable

Estimacin

Error estndar

Constante

18,36

2,375

Edad
gestacional

- 0,6819

0,08908

Z95%

Podemos decir con error inferior al 5% que existe asociacin entre la mortalidad de los RN
prematuros y su edad gestacional en el rango estudiado.

C aptulo 8

Anlisis de regresin logstica simple


Estimaciones de los parmetros del modelo
logstico propuesto para los datos anteriores
Variable

Estimacin

Error estndar

Constante

18,36

2,375

Edad
gestacional

- 0,6819

0,08908

1/OR = 1,98

Un RN presenta casi 2 veces ms riesgo de


morir que otro RN con una semana ms

OR = 0,506

20

1 = - 0,6819

Es el riesgo de morir de un RN respecto


a otro que tiene una semana menos

Logit

10

- 10

24

25

26

27

28

29

Edad gestacional (semanas)

Representacin grfica de los logits en las diferentes edades


gestacionales estudiadas

Cul es el riesgo de morir de un RN


con 25 semanas en relacin a otro de 29
semanas?

OR = e1 (X1-X2)
OR = e -0,6819 (25-29) = 15,30

Pgina 869

C aptulo 8

Pregunta de investigacin
Qu relacin existe entre el VCM del hemograma y la
probabilidad de tener dficit de los depsitos de hierro en
mdula sea?
Variable PREDICTORA
CUANTITATIVA continua
VCM
(hemograma)

Variable RESULTADO
CUALITATIVA dicotmica
Depsitos de Fe en mdula sea

Cul es el test estadstico ms acertado?

Pgina 870

C aptulo 8

Pgina 871

Anlisis de Regresin Logstica Simple


Qu relacin existe entre el VCM y los depsitos de
hierro en mdula sea?
Variable PREDICTORA

Variable RESULTADO

VCM

Depsitos de Fe medular

Estimaciones de los parmetros del modelo


logstico propuesto para los datos anteriores
Variable

Estimacin

Constante

- 6,1112

VCM

0,08485

Error estndar
0,02689

log

P
1- P

- 6,1112

0,08485 VCM

P = probabilidad de que existan depsitos de hierro medular

C aptulo 8

Pgina 872

Anlisis de Regresin Logstica Simple


Qu relacin existe entre la Ferritina srica y los depsitos
de hierro medular?
Variable PREDICTORA

Variable RESULTADO

Ferritina srica

Depsitos de Fe medular

Estimaciones de los parmetros del modelo


logstico propuesto para los datos anteriores
Variable

Estimacin

Constante

- 2,1290

FERRITINA

0,1713

Error estndar
0,04085

log

P
1

- 2,1290

0,1713 FERRITINA

P = probabilidad de que existan depsitos de hierro medular

C aptulo 8

Pgina 873

Tipos de test analticos estadsticos bivariantes de contraste


de hiptesis ms frecuentes
Variable
PREDICTORA o
Independiente (factor
de estudio)

Variable RESULTADO o Dependiente (Criterio de evaluacin)


Cualitativa nominal
dos
categoras

Cualitativa nominal > 2


categoras

Cualitativa ordinal o
Cuantitativa NO
paramtrica

Cuantitativa
paramtrica

Cualitativa dos
grupos
independientes

Chi cuadrado
Z comparacin de
proporciones
Test exacto de Fisher

Chi cuadrado

U de Mann-Whitney

T de Student
(prueba de Welch)

Cualitativa dos
grupos
apareados

Test de McNemar

Q de Cochran

Prueba de los rangos


de Wilcoxon

T de Student
para datos
emparejados

Cualitativa > 2 grupos


independientes

Chi cuadrado

Chi cuadrado

Prueba de KruskalWallis

Anlisis de la Varianza
(ANOVA)

Cualitativa > 2 grupos


apareados

Q de Cochran

Q de Cochran

Prueba de Friedman

Anlisis de la Varianza
de dos vas

Cuantitativa

Regresin logstica
simple

Regresin logstica multivariante

Correlacin de
Sperman
Tau de Kendall

Regresin lineal
Correlacin de Pearson

C aptulo 9

Captulo 9
Publicacin Bioestadstica: Anlisis bivariante.
Test de contraste de hiptesis.
Cualitativa policotmica versus cuantitativa.

Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Pgina 874

C aptulo 9

Pgina 875

Materiales y mtodos
Estructura
1. Tipo de diseo (estudio).
2. Sujetos incluidos (criterios de seleccin de la muestra)
3. Fuentes de informacin.
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales).
5. Instrumentos y procedimientos de medida (cuestionarios).
6. Definicin de las variables y covariables incluidas en el estudio (factor de
estudio y criterio de evaluacin).
7. Limitaciones y consideraciones ticas de la investigacin.
8. Pruebas estadsticas a utilizar (programa estadstico).

C aptulo 9

Fases del anlisis estadstico


1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE

Pgina 876

C aptulo 9

Pgina 877

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable
Independiente o
PREDICTORA

Variable
Dependiente o
RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de Fisher
Test de McNemar
Q de Cochran
REGRESIN LOGSTICA

Si el tamao muestral es grande


Si el tamao muestral es pequeo
Dos grupos de muestras repetidas o apareadas
Ms de dos grupos de muestras repetidas o apareadas
Varias variables predictoras cualitativas

Cualitativa

Cuantitativa

t de Student
Anlisis de la Varianza
Test de Mann-Whitney
Test de Wilcoxon
Test de Kruskall-Wallis
Test de Friedman

Compara medias entre dos grupos independientes


Compara medias entre ms de dos grupos independientes
Dos grupos independientes No paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, medidas repetidas
Ms de dos grupos No paramtrico medidas repetidas

Cuantitativa

Cualitativa

Regresin logstica simple


Regresin logstica multivariante

Una sola variable predictora cuantitativa


Varias variable predictoras cuantitativa o cualitativas

Cuantitativa

Cuantitativa

Regresin lineal simple


Correlacin de Pearson
Correlacin de Sperman
REGRESIN MLTIPLE

Paramtrico
Paramtrico
No paramtrico
Varias variables predictoras cuantitativas

Cualitativa

Superviviencia

Kaplan-Meier
Long-Rank
Regresin de COX

Curvas de superviviencia
Compara curvas de superviviencia
Anlisis Multivariante

C aptulo 9

Pgina 878

Tipos de test analticos estadsticos bivariantes de contraste


de hiptesis ms frecuentes
Variable
PREDICTORA o
Independiente (factor
de estudio)

Variable RESULTADO o Dependiente (Criterio de evaluacin)


Cualitativa nominal
dos
categoras

Cualitativa nominal
>2
categoras

Cualitativa ordinal o
Cuantitativa NO
paramtrica

Cuantitativa
paramtrica

Cualitativa dos grupos


independientes

Chi cuadrado
Z comparacin de
proporciones
Test exacto de
Fisher

Chi cuadrado

U de Mann-Whitney

T de Student
(prueba de Welch)

Cualitativa dos grupos


apareados

Test de McNemar

Q de Cochran

Prueba de los
rangos
de Wilcoxon

T de Student
para datos
emparejados

Cualitativa > 2 grupos


independientes

Chi cuadrado

Chi cuadrado

Prueba de KruskalWallis

Anlisis de la Varianza
(ANOVA)

Cualitativa > 2 grupos


apareados

Q de Cochran

Q de Cochran

Prueba de Friedman

Anlisis de la Varianza
de dos vas

Cuantitativa

Regresin logstica

Regresin logstica

Correlacin de
Sperman
Tau de Kendall

Regresin lineal
Correlacin de Pearson

C aptulo 9

Cualitativa versus cuantitativa


Cules son las pruebas estadsticas que tenemos que emplear?

Variable PREDICTORA
CUALITATIVA dicotmica

Variable RESULTADO
CUANTITATIVA

Pgina 879

C aptulo 9

Cualitativa policotmica versus cuantitativa


PARAMTRICOS

NO PARAMTRICOS

2 GRUPOS

Independientes
Aparejados

ANOVA para muestras


independientes

Kruskal-Wallis

Anlisis de la Varianza
para muestras dependientes o apareadas

Friedman

Variable predictora Cualitativa versus variable resultado Cuantitativa.

Pgina 880

C aptulo 9

Pgina 881

Anlisis de la varianza para un factor (ANOVA):


Condiciones de aplicacin
- Tipos de variables.
- Variable resultado: Cuantitativa numrica.
- Variable predictora: Cualitativa policotmicas.
- Normalidad: Variable resultado siga una distribucin normal o de gauss.
- Homogeneidad de las varianzas (homocedasticidad): Las varianzas de cada
grupo deben ser iguales.
- Prueba F de Snedecor.
- Test de Barttlet.
- Test de Levene.

C aptulo 9

Homogeneidad de varianzas (homocedasticidad)

- Prueba F de Snedecor
- Test de Barttlet
- Test de Levene

F=

Varianza mayor
Varianza menor

Ho: Las varianzas de ambos grupos son iguales

ANOVA

Ha: Existen diferencias entre las varianzas

KRUSKAL-WALLIS

Fcalculada < Ftabulada

p>0,05 (aceptamos la Ho)

Fcalculada > Ftabulada

p<0,05 (rechazamos la hiptesis nula)

Pgina 882

C aptulo 9

HIPERLIPIDEMIA
EDAD
SEXO
NIVEL CULTURAL
TABAQUISMO
OBESIDAD IMC
DIABETES

Excrecin urinaria
de sodio en 24 horas

Pgina 883

C aptulo 9

Test de la t de Student
Anlisis de la varianza para un factor
Variables PREDICTORAS

Variable RESULTADO

Sigue una Distribucin Normal?


Distribucin ANORMAL

Pgina 884

C aptulo 9

Pregunta de investigacin
Tienen la misma eficacia las dietas ensayadas para reducir
el nivel de colesterol-LDL?
Variable PREDICTORA
CUALITATIVA policotmica
Tipos de dieta
- Dieta control
- Dieta moderada
- Dieta estricta

Variable RESULTADO
CUANTITATIVA continua
LDL- colesterol

Cul es la prueba estadstica ms adecuada?

Pgina 885

C aptulo 9

Grupo Control (n=10)

Dieta moderada (n=10)

Dieta estricta (n=10)

+ 13

+ 10

12

+2

15

10

21

-8

20

-10

+5

15

-18

-16

+8

-10

+2

16

-20

-2

-15

Media = + 2,5

Media = - 10,1

Media = - 13,7

Pgina 886

C aptulo 9

Anlisis de la varianza para un factor

Hiptesis nula: 1

2 = 3 =

= n

Hiptesis alternativa: al menos una de las medias x es distinta

EFECTO debido a la dieta


Dispersin debida al AZAR (error)

F =

Varianza entre grupos (EFECTO)

Varianza residual (ERROR)

Varianza entre grupos (EFECTO)


Varianza residual (ERROR)

723,6
35,7

= 20,2

Pgina 887

C aptulo 9

Pgina 888

F =

15

Varianza entre grupos (EFECTO)


Varianza residual (ERROR)

723,6
35,7

= 20,2

10
5

Cambio de el LDL (mg/dl)

0
-5
- 10
-15
- 20
- 25

Control

Moderada

Estricta

Cambio en los niveles de colesterol-LDL (mg/dl) a los 6 meses de


tratamiento de intervencin diettica en 3 grupos de voluntarios
asignados a diferentes dietas

Tienen la misma eficacia las dietas ensayadas para reducir


el nivel de colesterol-LDL?

Cul es la intervencin diettica que ms reduce los niveles de colesterol-LDL?

Cambio de el LDL (mg/dl)


+10

- 10

- 20

Cambio en los niveles de colesterol-LDL (mg/dl) a los 6 meses de


tratamiento de intervencin diettica en 3 grupos de voluntarios
asignados a diferentes dietas
C aptulo 9

Control
Moderada
Estricta
Pgina 889

C aptulo 9

Anlisis de la varianza para un factor


Peso del RN

Suma de
cuadrados

gl

Media
cuadrtica

Significacin

Inter-grupos

1447,2

723,6

20,235

0,000

Intra-grupos

965,5

27

35,7

Total

2412,7

29

F calculada= 20,235 > F tabulado = 3,23;

p < 0,001

Hiptesis alternativa Ha: El reduccin del LDL difiere segn el tipo de dieta.
Cul es la intervencin diettica que ms reduce los niveles de colesterolLDL?

Pgina 890

C aptulo 9

Distribucin de la F de Snedecor
s12 12
valores " F " : F = 2 2
s2 2

Grados de libertad 1 y 2

1 = n1 - 1 2 = n2 - 1

El ANOVA para un factor para poblaciones con alto tamao


muestral presenta una distribucin de la F de Snedecor.

Pgina 891

C aptulo 9

Distribucin de la F de Snedecor

Ho

F calculada = 20,2
F

Ha

calculada >

tabulada

p < 0,05

F tabulado = 3,23 para los grados de libertad de la muestra

Pgina 892

C aptulo 9

Anlisis de la varianza para un factor


Anlisis de la Varianza para un factor
t

calculada < t tabulada


p > 0,05

Varianza entre grupos (EFECTO)

F=

Varianza residual (ERROR)

318,6
61,0

= 5,2

calculada > t tabulada


p < 0,05

Hiptesis nula H0

Hiptesis alternativa Ha

El cambio en el nivel de cLDL es


independiente de la intervencin
diettica

Las medias del cLDL de los


distintos grupos son diferentes
entre s, es decir NO pueden
considerarse iguales

Tienen la misma eficacia las dietas ensayadas para reducir el nivel de colesterol-LDL?
NO
Cul es la intervencin diettica que ms reduce los niveles de colesterol-LDL?
?

Pgina 893

C aptulo 9

Pgina 894

CONTRASTES A POSTERIORI

Cul es la intervencin diettica que ms reduce los niveles


de colesterol-LDL?
Procedimiento de SCHEFFE
Procedimiento de BONFERRONI
Mtodo de DUNNET
Mtodo de TUKEY
Mtodo de DUCAN
Mtodo de STUDENTNEWMAN-KEULS

Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se obtienen
intervalos de medias

C aptulo 9

Contrastes a posteriori en SPSS

Pgina 895

C aptulo 9

Pruebas Post Hoc


Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al
resto de las dietas comparadas.
Hiptesis alternativa Ha: La dieta ESTRICTA reduce el LDL de forma
significativa con respecto al resto de las dietas comparadas.
DIETAS
Control
Moderada
Estricta

Control

Moderada

Estricta

Ho =
Ha

Ho =
Ha
Ho =
Ha

Pgina 896

C aptulo 9

Procedimiento de Bonferroni
Dieta (I)

Dieta (J)

Diferencias de
medias (I J)

Error estndar

Significacin

Control

Moderada

12,60

2,674

0,000

Estricta

16,20

2,674

0,000

Control

- 12,60

2,674

0,000

Estricta

3,60

2,674

0,568

Control

- 16,20

2,674

0,000

Moderada

- 3,60

2,674

0,568

Moderada
Estricta

Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.

Pgina 897

C aptulo 9

Procedimiento de Scheffe
Dieta (I)

Dieta (J)

Diferencias de
medias (I J)

Error estndar

Significacin

Control

Moderada

12,60

2,674

0,000

Estricta

16,20

2,674

0,000

Control

- 12,60

2,674

0,000

Estricta

3,60

2,674

0,416

Control

- 16,20

2,674

0,000

Moderada

- 3,60

2,674

0,416

Moderada
Estricta

Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.

Pgina 898

C aptulo 9

Procedimiento de HSD de Tukey


Dieta (I)

Dieta (J)

Diferencias de
medias (I J)

Error estndar

Significacin

Control

Moderada

12,60

2,674

0,000

Estricta

16,20

2,674

0,000

Control

- 12,60

2,674

0,000

Estricta

3,60

2,674

0,383

Control

- 16,20

2,674

0,000

Moderada

- 3,60

2,674

0,383

Moderada
Estricta

Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.

Pgina 899

C aptulo 9

Procedimiento de Gabriel
Dieta (I)

Dieta (J)

Diferencias de
medias (I J)

Error estndar

Significacin

Control

Moderada

12,60

2,674

0,000

Estricta

16,20

2,674

0,000

Control

- 12,60

2,674

0,000

Estricta

3,60

2,674

0,459

Control

- 16,20

2,674

0,000

Moderada

- 3,60

2,674

0,459

Moderada
Estricta

Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.

Pgina 900

C aptulo 9

Procedimiento de Sidak
Dieta (I)

Dieta (J)

Diferencias de
medias (I J)

Error estndar

Significacin

Control

Moderada

12,60

2,674

0,000

Estricta

16,20

2,674

0,000

Control

- 12,60

2,674

0,000

Estricta

3,60

2,674

0,467

Control

- 16,20

2,674

0,000

Moderada

- 3,60

2,674

0,467

Moderada
Estricta

Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.

Pgina 901

C aptulo 9

Procedimiento de la t de Dunnett (bilateral)


Dieta (I)

Dieta (J)

Diferencias de
medias (I J)

Error estndar

Significacin

Control

Estricta

16,20

2,674

0,000

Moderada

Estricta

3,60

2,674

0,315

La prueba de Dunnett trata como un grupo como control y lo compara con


todos los dems grupos.

Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.

Pgina 902

C aptulo 9

Mtodo de Duncan
Tipo de dieta
Test de Duncan

Subconjunto para alfa


= 0,05
DIETA

Estricta

10

-13,700

Moderada

10

-10,100

Control

10

Significacin

Comparacin de la dieta estricta


con la moderada (p > 0,1).

2,500
0,189

1,000

Comparacin de la dieta control con las


dems (1- p = 1,000; p = 0,000).

Hiptesis nula Ho: La dieta CONTROL reduce el LDL de forma similar al resto de las dietas comparadas.
No existe diferencia entre la moderada y la estricta).

Pgina 903

C aptulo 9

Pgina 904

Mito 1: La sonrisa de la esfinge

ANOVA es un test paramtrico, es decir para usarlo se debe cumplir la


normalidad de la variable cuantitativa. Se cumple?
He observado que en los tres grupos de estudio slo tienen 10 sujetos. Ante
tan bajo volumen muestral
Cmo justificas esa supuesta normalidad?
Qu test has empleado para comprobar esa normalidad de la reduccin del
LDL?
Ests seguro que se cumplen los criterios para poder usar ANOVA?

C aptulo 9

Realidad 1: Respuesta de Edipo


Estadsticos descriptivos del LDL en cada dieta
Tipo de dieta Media
Reduccin del Control
LDL
Moderada
Estricta

Distribucin normal

DE

Mediana g1

EEg1

g2

EEg2

2,500

6,53

2,000

0,127

0,687

-0,732

1,334

-10,100

5,19

-8,500

- 0,880

0,687

-0,307

1,334

- 13,700

6,12

-15,000

1,172

0,687

1,909

1,334

[Asimetria] < 2 EEasimetra g1 < 2 EE g1


[Curtosis] < 2 EEcurtois

g2 < 2 EE g2

Pgina 905

C aptulo 9

Pgina 906

Realidad 1: Respuesta de Edipo


Test de Kolmogorov-Smirnov
Reduccin del LDL

Tipo de dieta

Estadstico Z

g.l

Significacin

Control

0,488

10

0,971

Moderada

0,657

10

0,782

Estricta

0,582

10

0,887

Ho: p > 0,05 NORMALIDAD

Test paramtricos

Ha: p < 0,05 ANORMALIDAD

Test NO paramtricos

Los test de normalidad ensayados dan un valor de p NO significativo (p > 0,05) en los 3 grupos (tipos de
dieta). Por tanto no hay evidencias suficientes para rechazar la hiptesis nula de normalidad de la variable
reduccin del peso en ambas muestras: podemos usar test PARAMTRICOS.

C aptulo 9

Pgina 907

Test ANOVA: Observaciones


- Los resultados del contraste estadstico F en la prueba ANOVA son sustancialmente
vlidos aunque los datos no sean normales, en ese sentido se dice que es una
tcnica ROBUSTA frente a desviaciones de la normalidad.
- El efecto de desigualdad de las varianzas en los grupos sobre el contraste F y
los contrastes de medias dependen de que el nmero de observaciones en cada
grupo sea igual o muy distinto. Si todos los grupos tienen el mismo nmero de
observaciones, el contraste F es igualmente exacto aunque las varianzas sean
distintas. Es decir, podemos despreocuparnos de las varianzas a efectos de
contrastes de medias, siempre que haya aproximadamente el mismo nmero de
observaciones por grupo, en caso contrario, diferencias entre las varianzas pueden
ser graves.

C aptulo 9

Pregunta de investigacin
El peso al nacer de los RN difiere segn la localidad
de origen?
Variable PREDICTORA
CUALITATIVA policotmica
Ciudad de origen
1. Ceuta
2. Algeciras
3. Tarifa
4. La Lnea

Variable RESULTADO
CUANTITATIVA continua
Peso del RN

Cul es la prueba estadstica ms adecuada?

Pgina 908

C aptulo 9

Pgina 909

Anlisis de la varianza para un factor

Hiptesis nula Ho: El peso al nacer de los RN NO difiere segn la localidad de


origen.
Hiptesis alternativa Ha: El peso al nacer de los RN difiere segn la localidad
de origen.
Estadsticos

Peso al nacer del RN

Localidad de origen

Ceuta

Algeciras

Tarifa

La Lnea

Media

3366,2

3217,2

3188,4

3169,0

Desviacin estndar (S)

393,0

444,1

471,5

361,4

1146

214

80

186

Varianza entre grupos (EFECTO)

F=

Varianza residual (ERROR)

= 21,3

C aptulo 9

Distribucin de la F de Snedecor

Ho

F calculada = 21,3
Ha

F tabulado = 3,23 para los grados de libertad de la muestra

Pgina 910

C aptulo 9

Pgina 911

Anlisis de la varianza para un factor


Peso del RN

Suma de
cuadrados

gl

Media cuadrtica

Significacin

Inter-grupos

10290751

3430250,3

21,351

0,000

Intra-grupos

260596358

1622

160663,599

Total

270887109

1625

F calculada= 21,3 > F tabulado = 3,23;

p < 0,001

Hiptesis alternativa Ha: El peso al nacer de los RN difiere segn la localidad


de origen.
Cul es la ciudad donde los nios nacen con mayor peso?

C aptulo 9

Pregunta de investigacin
Cul es la ciudad donde los nios nacen con mayor peso?

Variable PREDICTORA
CUALITATIVA policotmica
Ciudad de origen
1. Ceuta
2. Algeciras
3. Tarifa
4. La Lnea

Variable RESULTADO
CUANTITATIVA continua
Peso del RN

Cul es la prueba estadstica ms adecuada?

Pgina 912

C aptulo 9

CONTRASTES A POSTERIORI

Pruebas Post Hoc paramtrico


Procedimiento de SCHEFFE
Procedimiento de BONFERRONI
Mtodo de DUNNET
Mtodo de TUKEY
Mtodo de DUCAN
Mtodo de STUDENTNEWMAN-KEULS

Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se comparan los
grupos de 2 en 2
Se obtienen
intervalos de medias

Pgina 913

C aptulo 9

Pgina 914

Pruebas Post Hoc


Hiptesis nula Ho: Los RN que nacen en Ceuta tiene un peso medio similar
al resto de los RN de las otras ciudades.
Hiptesis alternativa Ha: Los RN que nacen en Ceuta tiene mayor peso
medio que el resto de las ciudades.
Ciudades
Ceuta
Algeciras
Tarifa
La Lnea

Ceuta

Algeciras

Tarifa

La Lnea

Ho =
Ha

Ho =
Ha

Ho =
Ha

Ho =
Ha

Ho =
Ha
Ho =
Ha

C aptulo 9

Pgina 915

Procedimiento de Scheffe
Ciudad (I)

Ciudad (J)

Diferencias de
medias (I J)

Error estndar

Significacin

Ceuta

Algeciras

148.92

29,85

0,000

Tarifa

177,79

46,35

0,002

La Lnea

197,13

31,69

0,000

Ceuta

- 148,92

29,85

0,000

Tarifa

28,87

52,53

0,960

La Lnea

48,21

40,18

0,696

Ceuta

- 177,79

46,35

0,002

Algeciras

- 28,87

52,53

0,960

La lnea

19,34

53,59

0,988

Ceuta

- 197,13

31,69

0,000

- 48,21

40,18

0,696

- 19,92

53,59

0,988

Algeciras

Tarifa

La Lnea

Tarifa

Hiptesis alternativa Ha: Los RN que nacen en Ceuta tiene mayor peso medio que el resto de las ciudades.

C aptulo 9

Pgina 916

Procedimiento de Bonferroni
Ciudad (I)

Ciudad (J)

Diferencias de
medias (I J)

Error estndar

Significacin

Ceuta

Algeciras

148.92

29,85

0,000

Tarifa

177,79

46,35

0,001

La Lnea

197,13

31,69

0,000

Ceuta

- 148,92

29,85

0,000

Tarifa

28,87

52,53

1,000

La Lnea

48,21

40,18

1,000

Ceuta

- 177,79

46,35

0,001

Algeciras

- 28,87

52,53

1,000

La lnea

19,34

53,59

1,000

Ceuta

- 197,13

31,69

0,000

- 48,21

40,18

1,000

- 19,92

53,59

1,000

Algeciras

Tarifa

La Lnea

Tarifa

Hiptesis alternativa Ha: Los RN que nacen en Ceuta tiene mayor peso medio que el resto de las ciudades.

C aptulo 9

Pgina 917

Procedimiento de Duncan
Procedencia
Test de Duncan

Subconjunto para alfa


= 0,05
Ciudad

La Lnea

186

3169,03

Tarifa

80

3188,38

Algeciras

214

3217,24

Ceuta

1146

3366,16

0,960

0,298

1,000

Significacin

Comparacin de las 3 ciudades


(p > 0,1).

2 (Ceuta)

Comparacin de Ceuta con las dems


ciudades (1- p = 1,000; p = 0,000).

Hiptesis alternativa Ha: Los RN que nacen en Ceuta tiene mayor peso medio que el resto de las ciudades.

C aptulo 9

Cualitativa policotmica versus cuantitativa


PARAMTRICOS

NO PARAMTRICOS

2 GRUPOS

Independientes
Aparejados

ANOVA para muestras


independientes

Kruskal-Wallis

Anlisis de la Varianza
para muestras dependientes o apareadas

Friedman

Variable predictora Cualitativa versus variable resultado Cuantitativa.

Pgina 918

C aptulo 9

Pgina 919

La prueba de Kruskal-Wallis (comparar ms de dos grupos)


- Para la comparacin de una misma variable cuantitativa en ms de tres grupos.
Es la prueba NO paramtrica ms potente para comparar >2 variables continuas
independientes. Es el similar al test de ANOVA para un factor.
- La prueba de Kruskal-Wallis, es una alternativa a la prueba F del ANOVA
(anlisis de varianza) para diseos de clasificacin simple donde NO se cumple la
normalidad de la variable cuantitativa.
- En este caso se comparan varios grupos de la variable predictora (cualitativa
POLICOTMICA) pero usando la MEDIANA de cada uno de ellos, en lugar de las
medias, donde, n es el total de datos.
k
Ri2
12
H=
- 3(n + 1)
n(n + 1) i =1 ni

Ho: La mediana de las k poblaciones consideradas son iguales y


Ha: Al menos una de las poblaciones tiene mediana distinta a las otras

C aptulo 9

Pregunta de investigacin
Tienen la misma eficacia las dietas ensayadas en grupos de
5 individuos para reducir el nivel de colesterol-LDL?
Variable PREDICTORA
CUALITATIVA policotmica
Tipos de dieta
- Dieta control
- Dieta moderada
- Dieta estricta

Variable RESULTADO
CUANTITATIVA continua
LDL- colesterol

Cul es la prueba estadstica ms adecuada?

Pgina 920

C aptulo 9

Tienen la misma eficacia las dietas ensayadas para reducir


el nivel de colesterol-LDL?
Variaciones en los niveles de colesterol-LDL (mg/dl) a los 6 meses de
seguimiento en 3 grupos de voluntarios asignados a diferentes medidas de
intervencin diettica.
Grupo Control

Dieta moderada

Dieta estricta

+ 13

-4

+ 10

-8

- 12

+2

-9

- 15

-2

- 10

- 21

-8

- 20

N=5

N=5

N=4

Media = + 3

Media = - 10,2

Media = - 12

N = 14

Media total = - 6

Pgina 921

C aptulo 9

Resultados: Prueba de Kruskal-Wallis


Rangos

Cambio del LDLc

Tipo de DIETAS

Rango promedio

CONTROL

12,30

MODERADA

6,70

ESTRICTA

5,00

Total

15

Estadstico de contraste
N

15

Chi-cuadrado
gl

(K 1)

Significacin

7,308
2
0,026

Pgina 922

C aptulo 9

Test de Kruskal-Wallis
Test de Kruskal-Wallis
t

calculada < t tabulada


p > 0,05

X2 H = 7,3 p = 0,026

calculada > t tabulada


p < 0,05

Hiptesis nula H0

Hiptesis alternativa Ha

El cambio en el nivel de cLDL es


independiente de la intervencin
diettica

Las medias del cLDL de los


distintos grupos son diferentes
entre s, es decir NO pueden
considerarse iguales

Tienen la misma eficacia las dietas ensayadas para reducir el nivel de colesterol-LDL?
NO
Cul es la intervencin diettica que ms reduce los niveles de colesterol-LDL?
?

Pgina 923

Cambio de el LDL (mg/dl)


+10

+3

- 10,2

- 10
-12

- 20

Control
Moderada
Estricta
Cambio en los niveles de colesterol-LDL (mg/dl) a los 6 meses de
tratamiento de intervencin diettica en 3 grupos de 5 voluntarios
asignados a diferentes dietas
C aptulo 9
Pgina 924

C aptulo 9

CONTRASTES A POSTERIORI

Pruebas Post Hoc no paramtricas


Procedimiento de BONFERRONI
Procedimiento de IDK
Mtodo de HOLM
Mtodo de HOLLAND-COPENHAVER
Mtodo de HOCHBERG
Mtodo de HOMMEL
Mtodo de ROM

Pgina 925

C aptulo 9

Med Clin (Barc) 2006;127:41-6.

Pgina 926

C aptulo 9

Pgina 927

C aptulo 9

Pregunta de investigacin
Qu relacin existe entre los niveles de calprotectina fecal
y las diferentes enfermedades orgnicas intestinales?
Variable PREDICTORA
CUALITATIVA policotmica
Controles
- Plipos
- Cncer colorrectal
- Enfermedad inflamatoria intestinal

Variable RESULTADO
CUANTITATIVA continua
Calprotectina fecal

Pgina 928

C aptulo 9

4.000
3.600

Calprotectina fecal (g/g)

3.200
2.800
2.400
2.000
1.600
1.200
800
400

217

Normal

Polipos

Cncer
colorrectal

Diagnstico endoscpico

Cul es la prueba estadstica ms adecuada?

Enfermedad
inflamatoria
intestinal

Pgina 929

C aptulo 9

Qu relacin existe entre los niveles de calprotectina fecal


y las diferentes enfermedades orgnicas intestinales?
Concentraciones de calprotectina fecal (g/g)
Grupos

Media

DE

Controles

117

113,7

113,1

Plipos

28

158,3

155,8

Cncer colorrectal

20

726,6

533,2

Enfermedad inflamatoria intestinal

25

2171,1

2133,6

Test de KRUSKAL-WALLIS

p < 0,001

Pgina 930

C aptulo 9

Pgina 931

Anlisis estadstico (fragmento del texto)

El anlisis de los datos se llev a cabo mediante el programa estadstico SPSS 11.0. El
valor de la CPF se presenta como media y con un intervalo de confianza (IC) del 95%.
Se utiliz el test de Kruskal-Wallis para evaluar las diferencias entre los valores de CPF
entre los diferentes grupos y el coeficiente de Spearman para valorar la correlacin entre
este marcador y el ndice de actividad de la enfermedad en el grupo de pacientes con
enfermedad inflamatoria intestinal (EII).

C aptulo 9

Pgina 932

Resultados (fragmento del texto)


En la figura 1 se muestra los valores de CPF en los diferentes grupos de pacientes. Se
encontr un incremento del valor medio (DE) en pacientes con enfermedad inflamatoria
intestinal (EII) EII (2.171 [2.134] mg/kg) y CCR (727 [533] mg/kg) con diferencias
estadsticamente significativas con respecto al grupo 1 (114 [113] g/g, p < 0,001).

Discusin (fragmento del texto)


El presente trabajo muestra que la concentracin de CPF est significativamente elevada
en pacientes con procesos orgnicos en colon, fundamentalmente en el cncer colorrectal
y enfermedad inflamatoria intestinal (EII). Adems, los valores ms altos se alcanzan
en pacientes con EII, y sus valores se correlacionan con el grado de actividad de la
enfermedad.

C aptulo 9

Mito 1: La sonrisa de la esfinge

Me parece acertada la eleccin del test de KRUSKAL-WALLIS como


contraste de hiptesis, sin embargo
Qu test has empleado para comprobar esa supuesta anormalidad de la
calprotectina fecal?
Si la calprotectina no sigue la distribucin normal
Por qu utilizas la media y la desviacin estndar como estadsticos
descriptivos?

Pgina 933

C aptulo 9

Pgina 934

Mito 1: La sonrisa de la esfinge

El test de KRUSKAL-WALLIS muestra un nivel crtico que es menor de 0,05,


y slo podemos rechazar la hiptesis de igualdad de promedios, concluyendo
que los grupos comparados (control, plipos, cncer colorrectal y enfermedad
inflamatoria intestinaI), difieren en los niveles de calprotectina fecal. Sin
embargo el test no te permite decir que en la enfermedad inflamatoria
intestinal los valores son mayores.
Por qu dices que los valores ms altos se alcanzan en pacientes con
enfermedad inflamatoria intestinal, cuando eso no te lo permite el test
estadstico empleado?

C aptulo 9

Pgina 935

Mito 1: La sonrisa de la esfinge

Aunque existen procedimientos POCT HOC para efectuar comparaciones


mltiples tras obtener un estadstico H significativo, para analizar con SPSS
que grupo tiene un mayor valor de CPF puedes utilizar la U de Mann-Whitney
para dos muestras independientes, pero acompaada de la correccin de
Bonferroni para controlar la probabilidad de cometer un error alfa.
Puesto que con 4 grupos de la variable predictora; control (CT), polipos (PL),
cncer colorrectal (CCR) y enfermedad inflamatoria intestinal (EII), necesitas
hacer 6 comparaciones 2 a 2 (CT-PL, CT-CCR, CT-EII, PL-CCR, PL-EII,
CCR-EII), la aplicacin de la correccin de Bonferroni te llevar a basar
vuestras decisiones en un nivel de significacin de 0,05/6 = 0,0083. Es decir,
consideraremos que dos grupos comparados difieren significativamente
cuando el nivel crtico obtenido (p) sea inferior a 0,0083.

C aptulo 9

Test de Kruskal-Wallis
VENTAJAS

INCONVENIENTES

Permite datos ordinales y cuantitativos


discretos

Menor potencia estadstica

No es necesaria la normalidad (test no


paramtrico)

Menor sensibilidad para detectar


diferencias entre grupos

El tamao muestral puede ser pequeo

No permite construir intervalos de


confianza

Pgina 936

C aptulo 9

Prueba de la Mediana

- Su objetivo es comparar las medianas de dos muestras y determinar si


pertenecen a la misma poblacin o no.
- Se calcula la mediana de todos los datos conjuntamente. Despus, se divide
cada muestra en dos subgrupos: uno para aquellos datos que se siten por
encima de la mediana y otro para los que se siten por debajo.
- La prueba de chi-cuadrado determinar si las frecuencias observadas en cada
grupo difieren de las esperadas con respecto a una distribucin de frecuencias
que combine ambas muestras.
- Esta prueba est especialmente indicada cuando los datos sean extremos o
estn sesgados.

Pgina 937

C aptulo 9

Pregunta de investigacin
Tienen la misma eficacia las dietas ensayadas para reducir
el nivel de colesterol-LDL?
Variable PREDICTORA
CUALITATIVA policotmica
Tipos de dieta
- Dieta control
- Dieta moderada
- Dieta estricta

Variable RESULTADO
CUANTITATIVA continua
LDL- colesterol

Cul es la prueba estadstica ms adecuada?

Pgina 938

C aptulo 9

Grupo Control (n=10)

Dieta moderada (n=10)

Dieta estricta (n=10)

+ 13

+ 10

12

+2

15

10

21

-8

20

-10

+5

15

-18

-16

+8

-10

+2

16

-20

-2

-15

Media = + 2,5

Media = - 10,1

Media = - 13,7

Pgina 939

C aptulo 9

Prueba de la Mediana
Tipo de dietas
Control

Moderada

Estricta

> Mediana

Mediana

Hay 3 casillas con frecuencia esperada menor de 5.


La frecuencia de casilla esperada mnima es de 4,7

Estadstico de contraste

LDL

30

Mediana

- 8,000

Chi-cuadrado

13,125

gl

(K 1)

Significacin

0,001

Pgina 940

C aptulo 9

Test de Jonckheere-Terpstra

- Cuando no se cumplen las condiciones para el ANOVA, hay tres tests


disponibles: H de Kruskal-Wallis, mediana y Jonckheere-Terpstra.
- El test H de Kruskal-Wallis, una extensin del test U de Mann-Whitney es el
anlogo no-paramtrico del ANOVA.
- El test de la mediana, que es una prueba ms general pero no tan potente,
detecta diferencias en la situacin y forma de las distribuciones. Ambas pruebas
asumen que no hay un ordenamiento a priori de las k poblaciones de las que se
han extrado las muestras.
- Cuando hay una ordenacin natural a priori (ascendente o descendente) de las
k poblaciones, es preferible usar el test de Jonckheere-Terpstra.

Pgina 941

C aptulo 9

74 pacientes ingresados en una UCI y queremos comparar las


estancias generadas en dicha unidad entre tres grupos de pacientes clasificados en funcin de la edad (jvenes, maduros y
ancianos)
Variable PREDICTORA 1
CUALITATIVA ordinal
Grupos etarios
- Jvenes
- Maduros
- Ancianos

Variable RESULTADO
CUANTITATIVA
Estancia
- Das

Cul es el test estadstico ms acertado?

Pgina 942

C aptulo 9

Pgina 943

Estadsticos descriptivos
Variable resultado

ESTANCIA

Media

DE

EEM

Mediana

Variable predictora
Grupos etarios

JVENES

28

5,18

11,17

2,11

2,00

MADUROS

23

9,22

15,29

3,19

3,00

ANCIANOS

23

21,51

21,52

4,49

3,00

Variable resultado

ESTANCIA

EE1

EE1

Variable predictora
Grupos etarios

JVENES

28

3,944

0,441

16,048

0,858

MADUROS

23

2,760

0,481

8,430

0,935

ANCIANOS

23

2,290

0,481

5,682

0,935

Distribucin normal

g1 < 2 EE g1 g2 < 2 EE g2

La variable resultado ESTANCIA, como casi todas las que se refieren al tiempo, es una variable conocida
por su distribucin alejada de lo normal. Si el tamao de los grupos que se estudian es pequeo menor
de 30, no sera adecuada la utilizacin de mtodos paramtricos (ANOVA) y deberamos recurrir a los
clsicos no paramtricos (KRUSKAL-WALLIS).

C aptulo 9

Media
Media
Mediana

Mediana

Pgina 944

C aptulo 9

Pgina 945

Test de normalidad
Variable resultado
ESTANCIA
Variable predictora
Grupos etarios

Test de Kolmogorov-Smirnov
N

Estadstico Z Significacin

Jvenes

28

2,301

0,000

Maduros

23

1,668

0,008

Ancianos

23

1,236

0,097

Total

74

2,829

0,000

Ho: p > 0,05 NORMALIDAD Test paramtricos


Ha: p < 0,05 Test NO paramtricos
El test de normalidad ensayado da un valor de p significativo (p < 0,05). Por tanto hay evidencias suficientes
para rechazar la hiptesis nula de normalidad de la variable ESTANCIA en UCI en los grupos. No se puede
asumir la normalidad.

C aptulo 9

Prueba de la homogeneidad de las varianzas


Test de Levene
Variable resultado ESTANCIA en UCI (das)
Estadstico de Levene

gl1

gl2

Significacin

3,707

71

0,022

El test de Levene (1960) se usa para contrastar si los 3 grupos comparados tienen la misma varianza, es
decir, la homogeneidad de varianzas. Para poder utilizar el anlisis de la varianza es necesario que las
varianzas son iguales para todos los grupos. De ah la importancia de verificar con el test de Levene esa
hiptesis.

Ho: Las varianzas de ambos grupos son iguales


Ha: Existen diferencias entre las varianzas
p > 0,05 (aceptamos la Ho)
p < 0,05 (rechazamos la hiptesis nula)

ANOVA
KRUSKAL-WALLIS

ANOVA
KRUSKAL-WALLIS

Pgina 946

C aptulo 9

Reflexiones: existen varios incumplimientos para el


ANOVA
1. Ausencia de normalidad.
2. Ausencia de homocedasticidad: el test de Levene para valorar la
homogeneidad de las variancias muestra que existen diferencias entre ellas (p =
0,027).
3. Y existencia de valores anmalos (outliers) que impiden la utilizacin de
mtodos paramtricos (ANOVA clsico).
Tenemos que recurrir a los clsicos no paramtricos de Kruskal-Wallis o, mejor, a
mtodos robustos como la generalizacin robusta del test Welch, que utiliza medias
-recortadas muestrales y es capaz de detectar diferencias significativas entre los
grupos.

Pgina 947

C aptulo 9

Resultados: Prueba H de Kruskal-Wallis


Clculo de Rangos
GRUPO ETARIO

Rango promedio

JVENES

28

31,00

MADUROS

23

38,37

ANCIANOS

23

44,54

Total

74

Estadstico de contraste
Chi-cuadrado
gl

(K 1)

Significacin

ESTANCIA
5,234
2
0,073

Hiptesis nula Ho: La estancia en UCI de los pacientes estudiados NO difiere segn el
grupo etario.

Pgina 948

C aptulo 9

Test de Jonckheere-Terpstra (J-T)


Estadstico de contraste

ESTANCIA

Nmero de niveles

74

Estadstico de J-T observado

1136,500

Media del estadstico J-T

908,500

Desviacin tpica del estadstico J-T

99,118

Estadstico de J-T tipificado

2,305

Significacin (bilateral)

0,021

Hiptesis alternativa Ha: La estancia en UCI de los pacientes estudiados difiere segn el
grupo etario.

Pgina 949

C aptulo 9

Cualitativa policotmica versus cuantitativa


PARAMTRICOS

NO PARAMTRICOS

2 GRUPOS

Kruskal-Wallis

Independientes

Anlisis de la Varianza
para muestras independientes

Aparejados

ANOVA
para medidas repetidas

Friedman

Variable predictora Cualitativa versus variable resultado Cuantitativa.

Pgina 950

C aptulo 9

Anlisis de la Varianza (ANOVA) para muestras


dependientes o apareadas (medidas repetidas)
- Anlisis de la variancia (ANOVA) se utiliza para la obtencin del coeficiente de
correlacin intraclase (CCI).
- En los estudios que evalan la concordancia, cada sujeto es examinado por
ms de un observador, siendo adecuado realizar un anlisis de la variancia
(ANOVA) para medidas repetidas (generalizacin de la prueba de la t de Student
para datos apareados).
- Este tipo de diseo permite aislar la variabilidad entre pacientes y
concentrarnos en la variabilidad debida al factor de inters; en el anlisis de la
variancia simple, la variabilidad entre pacientes est incluida en la variabilidad
residual.

Pgina 951

C aptulo 9

Pgina 952

Experimento diseado para estudiar el efecto del paso del tiempo sobre la calidad del recuerdo y realizacin
prctica de estudios con aplicacin de la estadstica de los 30 alumnos que han realizado el curso de
BIOESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD. Se evala el grado de conocimientos con
el mismo examen de 20 preguntas tipo test en 4 momentos diferentes; inmediatamente despus de finalizar
el curso, al ao, a los 2 aos, y a los 3 aos del curso. Se valora el nmero de respuestas correctas.
TIEMPO

Media

DE

EE1

EE1

INICIO

30

15,53

2,776

0,014

0,427

- 0,946

0,833

PRIMER AO

30

12,00

2,626

- 0,159

0,427

- 0,515

0,833

SEGUNDO AO

30

9,37

2,282

0,334

0,427

0,412

0,833

TERCER AO

30

8,03

2,539

0,366

0,427

- 0,647

0,833

TIEMPO

Test de Kolmogorov-Smirnov
N

Estadstico Z

Significacin

INICIO

30

0,618

0,839

PRIMER AO

30

0,548

0,925

SEGUNDO AO

30

0,679

0,746

TERCER AO

30

0,648

0,795

C aptulo 9

Comparacin de > de 2 grupos apareados


Test de Kolmogorov-Smirnov
p > 0,05; Normalidad

Prueba de la esfericidad de Mauchly


p > 0,05
ESFERICIDAD
Contrastes UNIVARIADOS

p < 0,05

p < 0,05
NO ESFERICIDAD
Contrastes MULTIVARIADOS

p < 0,05

POST HOC: Procedimiento de BONFERRONI: Comparacin por pares

Pgina 953

C aptulo 9

Pgina 954

Prueba de la homogeneidad de las varianzas


Prueba de la esfericidad de Mauchly
Efecto intra-sujetos
TIEMPO

Prueba de esfericidad de Mauchly


W de Mauchly

Chi cuadrado

g.l

Significacin

0,803

6,096

0,297

Para el ANOVA de medidas repetidas es conveniente suponer que las varianzas de las diferencias entre
cada dos niveles del factor TIEMPO son iguales. Con los 4 niveles, tenemos 6 pares de combinaciones
dos a dos entre niveles; inicio-1ao, inicio-2ao, inicio-3 ao, 1ao-2ao, 1 ao-3ao, 2ao3ao. Calculando las diferencias entre las puntuaciones de esos 6 pares, tendremos 6 nuevas variables.
Este supuesto equivale a afirmar que la matriz de varianzas-covarianzas es circular o esfrico. Para el
procedimiento de medidas repetidas esto se realiza con la prueba de esfericidad de MAUCHLY. Puesto que
la significacin estadstica asociada al estadstico W de Mauchly es de 0,297, (mayor de 0,05), NO podemos
rechazar la hiptesis nula de esfericidad. La matriz de las varianzas-covarianzas es ESFRICA.

C aptulo 9

Pgina 955

Prueba de la esfericidad de Mauchly


Efecto intra-sujetos
TIEMPO

Epsilon
Greenhous e-Geisser

Hunh-Feldt

Lmite-interior

0,865

0,958

0,333

Cuando el estadstico W de Mauchly nos lleve al rechazo de la esfericidad (NO ESFERICIDAD), podemos
basar nuestra decisin en los estadsticos F MULTIVARIADOS que no les afecta la falta de esfericidad, o
bien podemos utilizar el estadstico F UNIVARIADO aplicando el ndice corrector EPSILON.
El ndice corrector EPSILON expresa el grado en que la matriz de varianzas-covarianzas se aleja de la
esfericidad. En condiciones de esfericidad perfecta, psilon vale 1. En este caso psilon es alto porque hay
ESFERICIDAD.
Existen 3 estimaciones del ndice psilon, Greenhous e-Geisser es la ms conservadora. El lmite inferior
expresa el valor que adoptara psilon en caso de incumplimiento extremo de la esfericidad. El valor
de EPSILON se utiliza para corregir el valor del F UNIVARIADO. En este caso NO es necesario utilizar
EPSILON porque se cumple la ESFERICIDAD (p > 0,05).

C aptulo 9

TIEMPO

Contrastes MULTIVARIADOS
Valor

GI de la hiptesis

GI del error Significacin

Traza de Pillai

0,902

83,25

27

0,000

Lambda de Wilks

0,098

83,25

27

0,000

Traza de Hotelling

9,250

83,25

27

0,000

Raz mayor de Roy

9,250

83,25

27

0,000

La tabla contiene 4 estadsticos multivariados: Traza de Pillai, Lambda de Wilks, Traza de Hotelling, Raz
mayor de Roy. Se interpretan de la misma forma que todos los estadsticos ya estudiados; puesto que la
significacin de cada uno de ellos (p < 0,001) es menor que 0,05, podemos rechazar la hiptesis nula
de igualdad de las medias y concluir que la calidad del recuerdo de los conocimientos de bioestadstica
adquiridos no es la misma en los 4 momentos temporales definidos en el factor tiempo.

Ha: La calidad del recuerdo de los conocimientos de bioestadstica NO es la misma en


los 4 momentos considerados.

Pgina 956

C aptulo 9

TIEMPO

Pgina 957

Contrastes UNIVARIADOS: Prueba de efectos INTRA-SUJETOS


Suma de cuadrados gl
tipo III

Media cuadrtica

Significacin

Esfericidad asumida

984,067

328,022

103,236

0,000

Greenhouse-Geisser

984,067

2,596

379,006

103,236

0,000

Huynh-Feldt

984,067

2,874

342,361

103,236

0,000

Lmite-inferior

984,067

1,000

984,067

103,236

0,000

Si de cumple la ESFERICIDAD (homogeneidad de las varianzas) es preferible utilizar la aproximacin


UNIVARIADA (esfericidad asumida), ya que en condiciones de esfericidad, el estadstico UNIVARIADO F
(F= 103,236) es ms potente que los estadsticos MULTIVARIADOS de la tabla anterior (F= 83,246), sobre
todo con muestras pequeas, aunque, si ambos estadsticos conducen a la misma conclusin es irrelevante
utilizar uno u otro.
Observando los resultados de esta tabla vemos que las cuatro versiones del estadstico F UNIVARIADO (la
no corregida y las 3 corregidas con el valor de EPSLION) conducen a la misma conclusin, que coincide
con la ya alcanzada en la tabla de contrastes MULTIVARIADOS, por tanto, de nuevo rechazamos la Ho
(igualdad de medias) y aceptamos la Ha.
Ha: la calidad del recuerdo de los conocimientos NO es la misma en los 4 momentos considerados.

C aptulo 9

TIEMPO

MEDIAS MARGINALES ESTIMADAS


Media

Error tpico

Lmite inferior del IC95% Lmite inferior del IC95%

INICIO

15,553

0,507

14,494

16,570

1 ao

12,000

0,479

11,019

12,981

2 ao

9,367

0,417

8,515

10,219

3 ao

8,033

0,464

7,085

8,981

Se observa en la tabla que la media de los conocimientos adquiridos en el curso van disminuyendo
paulatinamente con el paso del TIEMPO.

Esta disminucin es estadsticamente significativa en cada uno de los


estratos temporales?

Pgina 958

C aptulo 9

Grfico de perfil representando el efecto del factor


tiempo
Medidas marginales estimadas

16

Se observa en el grfico que los conocimientos


adquiridos en el curso van disminuyendo
paulativamentre con el paso del TIEMPO en
todos los intervalos ensayados (p< 0,05)

14

12

10

8
Inicio

1 ao

2 ao

TIEMPO

Qu test has utilizado para llegar a esa conclusin?

3 ao

Pgina 959

C aptulo 9

TIEMPO

Pgina 960

Pruebas de CONTRASTES INTRA-SUJETOS


Suma de cuadrados gl
tipo III

Media cuadrtica

Significacin

LINEAL

947,527

947,527

206,956

0,000

CUADRTICO

36,300

36,300

13,815

0,001

CBICO

0,240

0,240

0,103

0,750

La tabla ofrece contrastes polinmicos, de tipo ortogonal, mostrando tantos contrastes como niveles tiene el
factor tiempo menos uno, como el factor tiempo tiene 4 niveles, aparecen 3 contrastes (lineal, cuadrtico y
cbico).
Si miramos la significacin (p) asociados a cada estadstico F podemos rechazar las hiptesis nulas
referidas a los componentes lineal y cuadrtico, pero no la referida al componente cbico. Podemos
concluir que las medias de los conocimientos adquiridos en el curso en cada momento temporal se ajustan
significativamente tanto a una lnea recta (componente lineal) como a una curva (componente cuadrtico).
Pero como existe ms de un componente significativo se elige el de mayor orden (modelo lineal) (mayor
valor de F, y mejor significacin). El grafico del perfil siguiente nos ayuda a comprender con ms claridad lo
que est ocurriendo.

C aptulo 9

Pruebas Post Hoc Anova apareado


TIEMPOS
INICIO
1 AO
2 AO
3 AO

INICIO

1 AO

2 AO

3 AO

Ho =
Ha

Ho =
Ha

Ho =
Ha

Ho =
Ha

Ho =
Ha
Ho =
Ha

Pgina 961

C aptulo 9

Procedimiento de Bonferroni: Comparacin por pares


Tiempo (I)

Tiempo (J)

Diferencias de
medias (I J)

Error estndar

Significacin

Inicio

1 ao

3,533

0,417

0,000

2 ao

6,167

0,407

0,000

3 ao

7,500

0,544

0,000

Inicio

- 3,533

0,417

0,000

2 ao

2,633

0,405

0,000

3 ao

3,967

0,531

0,000

Inicio

- 6,167

0,401

0,000

1 ao

- 2,633

0,405

0,000

3 ao

1,333

0,440

0,031

Inicio

- 7,500

0,544

0,000

1 ao

- 3,9967

0,531

0,000

2 ao

- 1,333

0,440

0,031

1 ao

2 ao

3 ao

Pgina 962

C aptulo 9

Relacin entre las glucemias medias, la hemoglobina


glicosilada y el riesgo de aparicin de complicaciones
de la diabetes
RIESGO DE COMPLICACIONES

GLUCEMIAS MEDIAS

HbA1c (%)

60

90

120

150

180

210

RIESGO AUMENTADO

240

10

RIESGO ALTO

270

11

300

12

330

13

360

14

RIESGO BAJO
RIESGO MODERADO (control aceptable hasta 7,5%)

RIESGO CRTICO

MAL CONTROL
METABLICO
(> 9,5%)

Pgina 963

C aptulo 9

Pgina 964

Objetivo: Conocer si el curso de educacin diabetolgica mejora el control


metablico de un grupo de pacientes diabticos mal controlados (HbA1c > 8,0).
Material: Grupo de 30 individuos antes y despus de un programa de
educacin para el control diabtico (ECD).
Mtodo: Se evala la hemoglobina glicosilada antes (HbA1cPRE) y despus
del ECD (HbA1cPOST).
Se define una nueva variable HbA1cDIF = HbA1cPRE HbA1cPOST.
Hiptesis nula Ho X antes = X despus
( DIF = HbA1cPRE HbA1cPOST = 0)
Hiptesis alternativa H1 X antes X despus
(DIF = HbA1cPRE HbA1cPOST 0)

C aptulo 9

El curso de educacin diabetolgica (ECD) mejora el control diabtico de un grupo de pacientes mal controlados
(HbA1c > 8,0)?
Diabetes = Educacin
HbA1c ANTES

HbA1c DESPUS

Cul es la prueba estadstica ms adecuada?

Pgina 965

C aptulo 9

Pgina 966

Resultados 1 objetivo
HbA1c

Media

DE

EE1

EE2

INICIAL (PRE)

30

10,150

1,77

0,745

0,427

- 0,516

0,833

PRIMER AO (POST)

30

7,130

0,932

1,408

0,427

2,619

0,833

HbA1c

Test de Kolmogorov-Smirnov
Estadstico Z

Significacin

INICIAL (PRE) 30

0,827

0,501

PRIMER AO

1,034

0,235

30

Experimento diseado con dos objetivos:


1. Se evala el control metablico con los niveles de HbA1c antes y despus (al ao) de la imparticin de un
curso intensivo de educacin diabetolgica a un grupo de 30 pacientes mal controlados (HbA1c > 8) para
comprobar si el curso ha sido til en la mejora del control glucmico a CORTO plazo.
2. Estudiar el efecto del paso del tiempo (LARGO plazo) sobre el control metablico tras la realizacin de
un curso de educacin diabetolgica en un grupo de 30 pacientes con diabetes mal controlada (HbA1c > 8),
realizando controles sucesivamente cada ao (2, 3 y 4 ao). Se quiere valorar si es necesario un nuevo
curso y con que frecuencia debera realizarse.

C aptulo 9

Resultados 1 objetivo
Variables

Media

Desviacin
estndar (s)

Error estndar de
la media (EEM)

HbA1cPRE

10,150

30

1,772

0,323

7,130

30

0,932

0,170

HbA1cPOST
Variable

Correlacin (r)

Significacin

HbA1cPRE versus HbA1cPOST

30

0,772

0,000

Variables

HbA1cPRE
HbA1cPOST

Diferencias relacionadas Intervalo de


confianza de la
diferencia

t calculada

gl

Significacin
bilateral

Media

EEM

Inferior

Superior

13,692

29

0,000

3,020

1,208

0,2206

2,569

3,471

t calculada < t tabulada

p>0,05 (aceptamos la Ho)

t calculada > t tabulada

p<0,05 (rechazamos la hiptesis nula)

Pgina 967

C aptulo 9

Pgina 968

Resultados 2 objetivo
HbA1c

Media

DE

EE1

EE2

PRIMER AO

30

7,130

0,932

1,408

0,427

2,619

0,833

SEGUNDO AO

30

7,207

0,835

1,110

0,427

1,805

0,833

TERCER AO

30

7,707

0,712

1,056

0,427

0,998

0,833

CUARTO AO

30

9,050

0,910

0,652

0,427

- 0,084

0,833

HbA1c

Test de Kolmogorov-Smirnov
N

Estadstico Z

Significacin

PRIMER AO

30

1,034

0,235

SEGUNDO AO

30

0,901

0,392

TERCER AO

30

0,990

0,281

CUARTO AO

30

0,737

0,649

2. Estudiar el efecto del paso del tiempo (LARGO plazo) sobre el control metablico tras la realizacin de
un curso de educacin diabetolgica en un grupo de 30 pacientes con diabetes mal controlada (HbA1c > 8),
realizando controles sucesivamente cada ao (2, 3 y 4 ao). Se quiera valorar si es necesario un nuevo
curso y con que frecuencia debera realizarse.

C aptulo 9

Pgina 969

Prueba de la homogeneidad de las varianzas


Prueba de la esfericidad de Mauchly
Efecto intra-sujetos
HbA1c

Prueba de esfericidad de Mauchly


W de Mauchly

Chi cuadrado

g.l

Significacin

0,368

27,717

0,000

Para el ANOVA de medidas repetidas es conveniente que las varianzas de las diferencias entre cada
dos niveles del factor TIEMPO son iguales. Con los 4 niveles, tenemos 6 pares de combinaciones dos
a dos entre niveles; 1ao-2ao, 1 ao-3ao, 1ao-4ao, 2ao-3ao, 2ao-4ao, 3ao- 4ao.
Calculando las diferencias entre las puntuaciones de esos 6 pares, tendremos 6 nuevas variables. Este
supuesto equivale a afirmar que la matriz de varianzas es circular o esfrico. Para el procedimiento de
medidas repetidas esto se realiza con la prueba de esfericidad de MAUCHLY. Puesto que la significacin
estadstica asociada al estadstico W de Mauchly es p < 0,001, (MENOR de 0,05), podemos rechazar la
hiptesis nula de esfericidad.
NO HAY ESFERICIDAD.

C aptulo 9

Pgina 970

Prueba de la esfericidad de Mauchly


Efecto intra-sujetos
TIEMPO

Epsilon
Greenhous e-Geisser

Hunh-Feldt

Lmite-interior

0,654

0,701

0,333

Cuando el estadstico W de Mauchly nos lleve al rechazo de la esfericidad (NO ESFERICIDAD), podemos
basar nuestra decisin en los estadsticos F MULTIVARIADOS que no les afecta la falta de esfericidad, o
bien podemos utilizar el estadstico F UNIVARIADO corregido aplicando el ndice corrector EPSILON.
El ndice corrector EPSILON expresa el grado en que la matriz de varianzas-covarianzas se aleja de la
esfericidad. En condiciones de esfericidad perfecta, psilon vale 1. Cuanto menor es psilon menor es la
esfericidad.
Existen 3 estimaciones del ndice psilon, Greenhous e-Geisser es la ms conservadora. El lmite inferior
expresa el valor que adoptara psilon en caso de incumplimiento extremo de la esfericidad. El valor de
EPSILON se utiliza para corregir el valor del F UNIVARIADO cuando no se cumple la esfericidad.

C aptulo 9

TIEMPO

Pgina 971

Contrastes UNIVARIADOS: Prueba de efectos INTRA-SUJETOS


Suma de cuadrados gl
tipo III

Media cuadrtica

Significacin

Esfericidad asumida

71,079

23,693

238,282

0,000

Greenhouse-Geisser

71,079

1,961

36,238

238,282

0,000

Huynh-Feldt

71,079

2,102

33,810

238,282

0,000

Lmite-inferior

71,079

1,000

71,079

238,282

0,000

Si se cumple la ESFERICIDAD es preferible utilizar la aproximacin UNIVARIADA (versin esfericidad


asumida), pues en condiciones de esfericidad el estadstico F UNIVARIADO es ms potente que los
estadsticos MULTIVARIADOS, sobre todo con muestras pequeas.
Si NO se cumple la ESFERICIDAD es preferible utilizar los estadsticos F MULTIVARIADOS (como en este
caso).

C aptulo 9

Comparacin de > de 2 grupos apareados


Test de Kolmogorov-Smirnov
p > 0,05; Normalidad

Prueba de la esfericidad de Mauchly


p > 0,05
ESFERICIDAD
Contrastes UNIVARIADOS

p < 0,05

p < 0,05
NO ESFERICIDAD
Contrastes MULTIVARIADOS

p < 0,05

POST HOC: Procedimiento de BONFERRONI: Comparacin por pares

Pgina 972

C aptulo 9

TIEMPO

Pgina 973

Contrastes MULTIVARIADOS
Valor

GI de la hiptesis

GI del error Significacin

Traza de Pillai

0,931

120,741

27

0,000

Lambda de Wilks

0,069

120,741

27

0,000

Traza de Hotelling

13,416

120,741

27

0,000

Raz mayor de Roy

13,416

120,741

27

0,000

La tabla contiene 4 estadsticos multivariados: Traza de Pillai, Lambda de Wilks, Traza de Hotelling, Raz
mayor de Roy. Se interpretan de la misma forma que todos los estadsticos ya estudiados; puesto que la
significacin de cada uno de ellos (p = 0,000) es menor que 0,05, podemos rechazar la hiptesis nula de
igualdad de las medias y concluir que el control metablico debido a la educacin del diabtico por el curso
no es el mismo en los 4 momentos temporales definidos en el factor tiempo.

Ha: el control metablico debido a la educacin del diabtico por el curso


no es la misma en los 4 momentos temporales definidos en el factor
tiempo.

C aptulo 9

TIEMPO

Pgina 974

MEDIAS MARGINALES ESTIMADAS


Media

Error tpico

Lmite inferior del IC95% Lmite inferior del IC95%

1 ao

7,130

0,170

6,782

7,478

2 ao

7,207

0,152

6,895

7,518

3 ao

7,707

0,130

7,441

7,973

4 ao

9,050

0,166

8,710

9,390

Se observa en la tabla que la media de la hemoglobina glicosilada va aumentando paulatinamente con el


paso del TIEMPO.

Este aumento es estadsticamente significativo en cada uno de los


estratos?

C aptulo 9

Grfico de perfil representando el efecto del factor


tiempo
9,5

Medidas marginales estimadas

9,0

Se observa en el grfico que la HbA1c


va aumentando con el paso del TIEMPO,
siendo este aumento significativo (p < 0,05) al
pasar del 2 ao al 3 ao, y del 3 al 4 ao.

8,5

8,0

7,5

7,0
1 ao

2 ao

3 ao

TIEMPO

Qu test has utilizado para llegar a esa conclusin?

4 ao

Pgina 975

C aptulo 9

Procedimiento de Bonferroni: Comparacin por pares


Tiempo (I)

Tiempo (J)

Diferencias de
medias (I J)

Error estndar

Significacin

1 ao

2 ao

- 0,077

0,041

0,425

3 ao

0,577

0,070

0,000

4 ao

- 1,920

0,098

0,000

1 ao

0,077

0,041

0,425

3 ao

- 0,500

0,068

0,000

4 ao

- 1,843

0,104

0,000

1 ao

0,577

0,070

0,000

2 ao

0,500

0,068

0,000

4 ao

- 1,343

0,090

0,000

1 ao

1,920

0,098

0,000

2 ao

1,843

0,104

0,000

3 ao

1,343

0,090

0,000

2 ao

3 ao

4 ao

Pgina 976

C aptulo 9

Cualitativa policotmica versus cuantitativa


PARAMTRICOS

NO PARAMTRICOS

2 GRUPOS

Kruskal-Wallis

Independientes

Anlisis de la Varianza
para muestras independientes

Aparejados

Anlisis de la Varianza
para muestras dependientes o apareadas

Friedman

Variable predictora Cualitativa versus variable resultado Cuantitativa.

Pgina 977

C aptulo 9

Pgina 978

Existen diferencias en el tiempo de reaccin frente a los 3


frmacos ensayados?
RESPUESTA A
A

Tiempo A
RESPUESTA B

Tiempo B
RESPUESTA C

Cul es el test estadstico ms adecuado?

Tiempo C

C aptulo 9

Pgina 979

Test de Friedman
- Es la versin NO PARAMTRICA del ANOVA para muestras apareadas.
- Utiliza la modificacin estadstica de Iman & Davenport (1980) que lo hace
menos conservador.
- El valor de z de cada hiptesis se puede utilizar para calcular la probabilidad
de error (valor p) mediante la distribucin normal.
- Se cumplen las condiciones impuestas por el test ANOVA?
SI: Utilizar ANOVA
NO: Utilizar el test de FRIEDMAN

C aptulo 9

Se ha medido el tiempo de la reaccin farmacolgica de 10 pacientes a 3


medicamentos diferentes.
Paciente

Frmaco A

Frmaco B

Frmaco C

10

10

15

10

15

20

11

15

12

12

10

12

15

10

15

14

12

18

10

14

17

12

10

10

14

16

Ho: No existen diferencias entre los tiempos de reaccin frente a los 3 frmacos.
Ha: Existen diferencias entre los tiempos de reaccin frente a los 3 frmacos.

Pgina 980

C aptulo 9

Test de Friedman
Estadstica descriptiva
Tratamiento

Mean

Standars Desviation

Minimum

Maximum

Frmaco A

10

10,40

2,458

7,00

15,00

Frmaco B

10

12,30

2,162

9,00

15,00

Frmaco C

10

14,40

3,565

8,00

20,00

Ranks
Tratamiento

Friedman test Statistics

Promedio de rangos

10

Frmaco A

1,35

Chi cuadrado

Frmaco B

2,00

gl

Frmaco C

2,65

Significacin

(K 1)

9,135
2
0,010

Ha: Existen diferencias entre los tiempos de reaccin frente a los 3 frmacos.

Pgina 981

C aptulo 9

Coeficiente de concordancia W de Kendall


- Mide le grado de concordancia entre un grupo de elementos y un grupo
de caractersticas.
- Si la concordancia es mxima W=1, si la concordancia es mnima W=0.

W=

S
1/12 K2 (N3 N) K Li

Donde:
w = coeficiente de concordancia de Kendall.
S = suma de los cuadrados de las diferencias observadas con respecto a un promedio.
N = Tamao de la muestra en funcin del nmero de tripletes, tetrapletes, quintupletes, etc.
K = nmero de variables incluidas.
Li = sumatoria de las ligas o empates entre los rangos.

Pgina 982

C aptulo 9

Coeficiente de concordancia W de Kendall


- El coeficiente W de Kendall y el estadstico 2 de Friedman son
aplicables al mismo tipo de situaciones.
- La hiptesis nula de que los tratamientos aplicados son iguales en su
efectividad es exactamente lo mismo que mantener la hiptesis nula
de ausencia de concordancia en los resultados de los tratamientos
ensayados.

Pgina 983

C aptulo 9

Pgina 984

Existen diferencias en la medida de la frecuencia cardaca


en los tres mdicos evaluados?
Mdico JEFE SERVICIO
MEDIDA A

A
Mdico RESIDENTE

10 PACIENTES

B
Mdico ADJUNTO
C

Cul es el test estadstico ms adecuado?

FC A
MEDIDA B
FC B
MEDIDA C
FC C

C aptulo 9

Pgina 985

Comparacin de las mediciones consecutivas de la FRECUENCIA CARDACA en


pulsaciones por minuto (ppm) en 10 pacientes realizada por tres mdicos diferentes: un
mdico A, jefe del servicio, un mdico B en periodo de formacin, y un mdico C adjunto
del mismo departamento.
Pacientes

Mdico JEFE
SERVICIO (A)

Medico
RESIDENTE (B)

Mdico ADJUNTO (C)

75

80

74

74

84

72

76

81

75

79

83

80

82

92

84

83

88

82

85

90

84

87

92

86

87

92

88

10

88

93

88

Media

81,6

87,5

81,3

DE

5,3

5,04

5,85

C aptulo 9

Test de Friedman
Estadsticos descriptivos
Mdico

Media

Desviacin estndar

Mnimo

Mximo

JEFE A

10

81,6

5,23

74

88

RESIDENTE B

10

87,5

5,04

80

93

ADJUNTO C

10

81,3

5,85

72

88

Rangos

Estadstico de contraste prueba de Friedman

Promedio de rangos

10

JEFE A

1,35

Chi cuadrado

RESIDENTE B

2,00

gl

ADJUNTO C

2,65

Significacin

(K 1)

15,846
2
0,000

Ha: Existen diferencias entre la medida de la frecuencia cardiaca en los tres mdicos.

Pgina 986

C aptulo 9

Coeficiente de concordancia W de Kendall


Rangos

Estadstico de contraste prueba de Kendall

Promedio de rangos

10

JEFE A

1,35

W de Kendall (*)

0,792

RESIDENTE B

2,00

Chi cuadrado

15,846

ADJUNTO C

2,65

gl

(K 1)

Significacin

2
0,000

(*) Coeficiente de concordancia de Kendall

Ha: Existen diferencias entre la medida de la frecuencia cardiaca en los tres mdicos.

Pgina 987

C aptulo 9

Pgina 988

Experimento diseado para estudiar el efecto del paso del tiempo sobre la calidad del
recuerdo y realizacin prctica de estudios con aplicacin de la estadstica de los 10
alumnos que han realizado el curso de BIOESTADSTICA APLICADA A LAS CIENCIAS
DE LA SALUD. Se evala el grado de conocimientos con el mismo examen de 20
preguntas tipo test en 4 momentos diferentes; inmediatamente despus de finalizar el
curso, al ao, a los 2 aos, y a los 3 aos del curso.

La calidad y cantidad del recuerdo de los conocimientos sobre bioestadstica


es la misma en los 4 momentos considerados?

C aptulo 9

Respuestas acertadas en funcin del tiempo transcurrido desde la realizacin del curso
Alumnos

Tiempo 0

1 ao

2 ao

3 ao

16

12

12

10

12

10

10

15

13

11

18

12

12

12

13

13

10

18

16

10

13

15

20

11

10

14

12

11

Cul es el test estadstico ms adecuado?

Pgina 989

C aptulo 9

Test de Friedman
Estadsticos descriptivos
Tiempo

Media

Desviacin estndar

Mnimo

Mximo

INICIO

10

15,30

2,710

12

20

1 AO

10

11,10

2,514

16

2 AO

10

9,20

1,932

12

3 AO

10

9,90

2,183

13

Rangos

Estadstico de contraste prueba de Friedman

Rango promedio

10

INICIO

3,95

Chi cuadrado

1 AO

2,50

gl

2 AO

1,70

Significacin

3 AO

1,85

(K 1)

20,868
3
0,000

Ha: la calidad del recuerdo de los conocimientos no es la misma en los 4 momentos


considerados.

Pgina 990

C aptulo 9

Coeficiente de concordancia W de Kendall


Rangos

Estadstico de contraste prueba de Kendall

Rango promedio

10

INICIO

3,95

W de Kendall (*)

0,698

1 AO

2,50

Chi cuadrado

20,868

2 AO

1,70

gl

3 AO

1,85

Significacin

(K 1)

3
0,000

(*) Coeficiente de concordancia de Kendall

Ha: La calidad del recuerdo de los conocimientos no es la misma en los 4 momentos


considerados

Pgina 991

C aptulo 10

Captulo 10
Publicacin Bioestadstica: Medidas de concordancia.
Variables cualitativas.

Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Pgina 992

C aptulo 10

Medidas de concordancia
- Fiabilidad de los procedimientos de medida empleados.
- Fleis: ni el ms elegante de los diseos seria capaz de paliar el dao
causado por un sistema de medida poco fiable.
- Error de medida: Variabilidad entre observadores.
- Estudios de fiabilidad.
- Sesgo entre observadores.
- Concordancia entre observadores.
- Indicadores del grado de variabilidad.
- Coeficiente de correlacin intraclase (variables cuantitativas).
- ndice de Kappa (variables cualitativas tipo categricos).

Pgina 993

C aptulo 10

Valoracin de la fiabilidad externa de las publicaciones de dos revistas


cientficas durante el ltimo quinquenio.
En 5 (4 de JAMA y uno de MC) de los 12 artculos se han llevado a
cabo tratamientos estadsticos no idneos para medir la concordancia,
mediante las siguientes pruebas de contraste de hiptesis:
- Comparacin de medias con la t de Student
- Test exacto de Fisher,
- Test de chi-cuadrado 2
- Anlisis de la varianza (ANOVA)
- Test de Wilcoxon
- Coeficiente de Spearman

Med Clin (Barc) 2003; 121 (20): 793-8

Pgina 994

C aptulo 10

Anlisis de concordancia: Variables Cualitativas

- ndice kappa de Cohen (2 observadores)


- ndice kappa de Fleiss (> 2 observadores)
- ndice kappa ponderado
- Prueba de homogeneidad de kappas

Pgina 995

C aptulo 10

ndice kappa de Cohen (medida dicotmica)

OBSERVADOR A
( 1 medicin)

OBSERVADOR B
( 2 medicin)

TOTAL

Anormal (+)

Normal (-)

Anormal (+)

a+b

Normal (-)

c+d

Total

a+c

b+d

Statistical methods for rates and proportions. Joseph L. Fleis. Ed.John Wiley New York 1981.

Pgina 996

C aptulo 10

Dos radilogos del programa de tuberculosis se les remiten radiografas de trax de 170
sujetos que estn controlados en una unidad de neumologa, y que se quiere estimar
el grado de concordancia entre ellos. Los radilogos A y B tienen que clasificar cada
radiografa en una de dos categoras:
(+) positiva (sospechosa de lesin tuberculosa).
(-) negativa (no sospechosa de lesin tuberculosa).
RADILOGO A

RADILOGO B

TOTAL

Anormal (+)

Normal (-)

Anormal (+)

58

39

97

Normal (-)

12

61

73

Total

70

100

170

k = 0,415

IC95% = 0,2862 0,5430

Pgina 997

C aptulo 10

Pgina 998

Cul es el grado de concordancia encontrado?


Medida de acuerdo

Valor de Kappa

EEk

Significacin

Kappa de Cohen

+ 0,415

0,0655

5,688

0,000

N de casos vlidos

200

Junto al ndice kappa aparece su error estndar EEk y el valor del


estadstico Z.
Puesto que el valor de p es muy pequeo (<0,001) podemos rechazar la
hiptesis nula y concluir que existe un ACUERDO significativamente ms
alto que el esperado por el azar.
Cmo se clasifica el grado de concordancia encontrado?

C aptulo 10

Pgina 999

ndice kappa de Cohen


k = 0 cuando la concordancia observada po es la que se esperada a causa del azar pe
k > 0 cuando la concordancia observada po es mayor de la esperada slo por el azar pe

Valoracin del ndice Kappa


Valor de k

Fuerza de concordancia

< 0,20

Pobre

0,21 0,40

Dbil

0,41 0,60

Moderada

0,61 0,80

Buena

0,81 1,00

Muy buena

Con los datos de la tabla se obtiene aplicando esta frmula un valor de k = 0,415 (IC95%:
0,2862 0,5430), que segn la clasificacin anterior calificaramos como una MODERADA
concordancia.

C aptulo 10

Pregunta de investigacin
Tienen los dos radilogos de mi servicio el mismo
criterio-juicio clnico para informar las radiografas?
Radilogo 2
Radilogo 1

Anormal

Dudosa

Normal

Anormal

18

Dudosa

10

Normal

53

Se enfrenta ambos radilogos a la tarea de categorizar una misma muestra


de 100 radiografas mediante la escala: anormal, dudosa, normal.
Cul es el test estadstico ms acertado?
Lpez de Ullibarri Galparsoro I, Pita Fernndez S. Medidas de concordancia: el ndice Kappa. Cad Aten
Primaria 1999; 6: 169-171.

Pgina 1000

C aptulo 10

ndice kappa de Fleiss


Medida de acuerdo

Valor de Kappa

EEk

Kappa de Fleiss

+ 0,660

0,044

N de casos vlidos

100

T aprox

Significacin

8,944

0,000

Coeficiente Gamma
Gamma

EEk

0,899

0,044

N de casos vlidos

100

T aprox

8,744

p
0,000

Cmo se clasifica el grado de concordancia encontrado?

Pgina 1001

C aptulo 10

ndice kappa de Fleiss


k = 0 cuando la concordancia observada po es la que se esperada a causa del azar pe
k > 0 cuando la concordancia observada po es mayor de la esperada slo por el azar pe

Valoracin del ndice Kappa


Valor de k

Fuerza de concordancia

< 0,20

Pobre

0,21 0,40

Dbil

0,41 0,60

Moderada

0,61 0,80

Buena

0,81 1,00

Muy buena

Con los datos de la tabla se obtiene aplicando esta frmula un valor de k = 0,660
(IC95%: 0,527-0,793), que segn la clasificacin anterior calificaramos como una buena
concordancia.

Pgina 1002

C aptulo 10

Pregunta de investigacin
Tienen los dos psiquiatras de mi servicio el mismo criteriojuicio clnico al diagnosticar una muestra de 200 pacientes?
Psiquiatra 2
Psiquiatra 1

Fbica

Histrica

Obsesiva

Depresiva

Fbica

20

Histrica

36

14

Obsesiva

43

Depresiva

33

Cul es el test estadstico ms acertado?

Pgina 1003

C aptulo 10

Medida de acuerdo

Valor de Kappa

EEk

Kappa de Fleiss

+ 0,538

0,046

N de casos vlidos

200

T aprox

12,921

Pgina 1004

Significacin
0,000

Junto al ndice kappa aparece su valor estandarizado (T aproximada),


resultado similar al resultante de dividir el valor de kappa por su error
estndar (EEk) (11,69).
Puesto que el valor de p es muy pequeo (<0,001) podemos rechazar la
hiptesis nula y concluir que existe un ACUERDO significativamente ms
alto que el esperado por el azar.
Cmo se clasifica el grado de concordancia encontrado?

C aptulo 10

ndice kappa de Fleiss


k = 0 cuando la concordancia observada po es la que se esperada a causa del azar pe
k > 0 cuando la concordancia observada po es mayor de la esperada slo por el azar pe

Valoracin del ndice Kappa


Valor de k

Fuerza de concordancia

< 0,20

Pobre

0,21 0,40

Dbil

0,41 0,60

Moderada

0,61 0,80

Buena

0,81 1,00

Muy buena

Con los datos de la tabla se obtiene aplicando esta frmula un valor de k = 0,538, que
segn la clasificacin anterior calificaramos como una MODERADA concordancia.

Pgina 1005

C aptulo 10

Pregunta de investigacin
Podemos sustituir el diabur-test por el clinitest para la medida
de la glucosuria?

Clinitest

Diabur-test 5000

Cul es el test estadstico ms acertado?

Banauch D, Koller PU, Bablok W. Evaluation of Diabur-Test 5000: a cooperative study carried out at 12
diabetes centers. Diabetes Care 1983; 6(3): 213-18.

Pgina 1006

C aptulo 10

Pgina 1007

Pregunta de investigacin
Se desea estimar la concordancia entre dos pruebas diagnsticas
de diabetes, el Diabur-Test5000 y el Clinitest en 1677 muestras
de orina. Calcula el valor de kappa sin ponderar y ponderado por
pesos cuadrticos.
Diabur-test 5000
Clinitest

Negativo

Trazas

++

+++

Negativo

452

Trazas

133

270

28

36

107

53

76

+++

12

28

81

35

++++

11

44

251

++

ndice kappa Ponderado

++++

C aptulo 10

Pgina 1008

Kappa ponderado. Si las categoras de clasificacin son ms de dos y estn definidas


en una escala ordinal, como por ejemplo sano, posiblemente enfermo y claramente
enfermo. A la hora de valorar el grado de discrepancia entre dos observadores, no es lo
mismo que uno clasifique a un sujeto como posiblemente enfermo y el otro lo declare
sano a que uno lo clasifique como sano y el otro como claramente enfermo. La
distancia entre ambas discrepancias no es la misma.
Cuando ciertos tipos de desacuerdo son ms acusados que otros, al investigador le puede
interesar tenerlo en cuenta en la construccin del ndice kappa. Para ello, se PONDERA
las diferentes discrepancias, usando una matriz de pesos que pueden variar segn el
criterio del investigador en funcin de lo que est analizando, aunque siempre cumpliendo
ciertas restricciones:
1. La matriz debe ser simtrica;
2. La diagonal de acuerdos se le asigna el mximo peso, que es 1 y el resto de pesos
deben ser inferiores, aunque siempre positivos o iguales a cero.

C aptulo 10

Medida de acuerdo

Valor de Kappa

EEk

Significacin

Kappa NO ponderado

+ 0,6706

0,013

57,098

0,0000

N de casos vlidos

1677

IC95%: 0,6450 0,6961

Medida de acuerdo

Valor

Acuerdo observado

+ 0,7376

Acuerdo esperado

+ 0,2035

Medida de acuerdo

Valor de Kappa

EEk

Significacin

Kappa ponderado

+ 0,9491

0,0033

38,982

0,0000

N de casos vlidos

1677

IC95%: 0,9427 0,9555

Medida de acuerdo

Valor

Acuerdo observado

+ 0,9856

Acuerdo esperado

+ 0,7165

Pgina 1009

C aptulo 10

Variabilidad en datos clnicos


Grado de acuerdo interobservador
Variables

Acuerdo preadiestramiento

Valor

(CCI / Kappa)

Acuerdo postadiestramiento

+ 0,9856

(CCI / Kappa)

+ 0,7165

+ 0,7165

Afectacin simtrica

0.14

0.79

Clase funcional

-0.08

0.65

Numero criterios diagnsticos

0.02

0.93

Sexo

Anticuerpos antinucleares

0.62

0.84

Valor mximo VSG

0.70

0.99

A. Gmez de la Cmara et al. Med Clin (Barc) 1997; 108:377-381

Pgina 1010

C aptulo 10

Pgina 1011

Limitaciones del estadstico Kappa

- El valor de kappa se ve afectado por la prevalencia del rasgo estudiado. Por tanto,
es necesario ser cuidadoso a la hora de generalizar los resultados de comparacin de
observadores en situaciones con prevalencias diferentes; esto quiere decir que kappa es
un estadstico descriptivo til, pero es inadecuado con fines de prediccin o inferencia.
- Kappa es dependiente del nmero de categoras. Cuantas ms categoras se estn
considerando, ms difcil ser clasificar correctamente los sujetos de observacin, lo que
implica valores de kappa ms bajos. Por tanto, debe tenerse en cuenta el nmero de
categoras a la hora de interpretar kappa.
- Para datos ordinales derivados de categorizar variables continuas, kappa depende
fuertemente las definiciones arbitrarias que se hacen de las categoras.

C aptulo 10

Se desea evaluar los conocimientos prcticos adquiridos por los residentes de


microbiologa a su paso por el departamento de micobacterias. Para ello se mide
la concordancia con el Especialista adjunto mediante la evaluacin conjunta de un
determinado nmero de tinciones de Ziehl Neelsen. Se desea estimar el grado de
concordancia de cada residente con el adjunto, y si el grado de adiestramiento ha
sido el mismo en los 4 residentes que han rotado por el departamento.

RESIDENTE

Cul es el test estadstico ms acertado?

ADJUNTO

Pgina 1012

C aptulo 10

Prueba de homogeneidad de las kappas


Hiptesis nula: k1

k2 = k3 =

= kn

Hiptesis alternativa: al menos una de las kappas kx es distinta

Comparacin de kappas: Distribucin de 2 de Pearson


Hiptesis nula Ho: Igualdad de las kappas comparadas. El grado de
aprendizaje no varia entre los distintos residentes.
Hiptesis alternativa Ha: Desigualdad de las kappas comparadas. El grado de
aprendizaje varia entre los distintos residentes. Existe al menos una kappa
diferente al resto.

Pgina 1013

C aptulo 10

RESIDENTE R1

ADJUNTO

TOTAL

Anormal (+)

Anormal (-)

Anormal (+)

320

30

350

Dudosa (-)

120

29

149

Total

440

59

499

P = 72,7%

Kappa

EEk

IC95%

0,132

0,043

0,048 0,215

Gamma (Q de Yule)

EEk

0,441

0,113

T aprox

3,027

T aprox

3.448

0,001

p
0,002

Pgina 1014

C aptulo 10

RESIDENTE R2

ADJUNTO

TOTAL

Anormal (+)

Anormal (-)

Anormal (+)

890

210

1100

Dudosa (-)

290

700

990

Total

1180

59

2090

P = 75,4%

Kappa

EEk

IC95%

0,518

0,019

0,481 0,555

Gamma (Q de Yule)

EEk

0,822

0,017

T aprox

27,549

T aprox

23,764

0,000

p
0,000

Pgina 1015

C aptulo 10

RESIDENTE R3

ADJUNTO

TOTAL

Anormal (+)

Anormal (-)

Anormal (+)

350

120

470

Dudosa (-)

70

550

620

Total

420

670

1090

P = 83,3%

Kappa

EEk

IC95%

0,640

0,024

0,593 0,686

Gamma (Q de Yule)

EEk

0,916

0,013

T aprox

25,914

T aprox

21,226

0,000

p
0,000

Pgina 1016

C aptulo 10

RESIDENTE R4

ADJUNTO

TOTAL

Anormal (+)

Anormal (-)

Anormal (+)

280

80

360

Dudosa (-)

60

550

610

Total

340

630

970

P = 82,3%

Kappa

EEk

IC95%

0,687

0,024

0,639 0,735

Gamma (Q de Yule)

EEk

0,940

0,011

T aprox

24,63

T aprox

21,425

0,000

p
0,000

Pgina 1017

C aptulo 10

Comparacin de kappas
Nmero de Kappas a comparar

Nivel de confianza

95%

Kappa global

IC95%

0,687

0,5379 0,5855

Prueba de la homogeneidad de kappas


Chi cuadrado

gl

Valor p

143,0515

0,0000

Hiptesis alternativa Ha: Desigualdad de las kappas comparadas. El grado de aprendizaje varia entre los
distintos residentes. Existe al menos una kappa diferente al resto.

Pgina 1018

C aptulo 10

Comparacin de kappas: Distribucin de 2 de Pearson

Grados de libertad = [ K - 1] [F - 1] = (2-1) (4 -1) = 3

2Pearson calculado = 143,05 > 2Pearson tabulado = 7,81


2 = 143,05
Ho

AZAR

Ha
7,81

AZAR

Hiptesis alternativa Ha: Desigualdad de las kappas comparadas. El grado de aprendizaje varia entre los
distintos residentes. Existe al menos una kappa diferente al resto.

Pgina 1019

C aptulo 10

Pgina 1020

Mito 1: La sonrisa de la esfinge


El valor de kappa se ve afectado por la prevalencia del rasgo estudiado. Por tanto, es
necesario ser cuidadoso a la hora de generalizar los resultados de comparacin de
observadores en situaciones con prevalencias diferentes; esto quiere decir que kappa es
un estadstico descriptivo til, pero es inadecuado con fines de prediccin o inferencia.
La prevalencia (porcentaje de tinciones positivas valoradas) es la misma en la evaluacin
de los 4 residentes comparados?
Si no son iguales NO podemos comparar los ndices kappa.

Gardner PL. Measuring attitudes to science: Unidimensionality and internal consistency revisited. Research
in Science Education 1995; 25: 283-9.

C aptulo 11

Captulo 11
Publicacin Bioestadstica: Medidas de concordancia.
Variables cuantitativas.

Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Pgina 1021

C aptulo 11

Medidas de concordancia
- Fiabilidad de los procedimientos de medida empleados.
- Fleis: ni el ms elegante de los diseos seria capaz de paliar el dao
causado por un sistema de medida poco fiable.
- Error de medida: Variabilidad entre observadores.
- Estudios de fiabilidad.
- Sesgo entre observadores.
- Concordancia entre observadores.
- Indicadores del grado de variabilidad.
- Coeficiente de correlacin intraclase (variables cuantitativas).
- ndice de Kappa (variables cualitativas tipo categricos).

Pgina 1022

C aptulo 11

Valoracin de la fiabilidad externa de las publicaciones de dos revistas


cientficas durante el ltimo quinquenio.
En 5 (4 de JAMA y uno de MC) de los 12 artculos se han llevado a
cabo tratamientos estadsticos no idneos para medir la concordancia,
mediante las siguientes pruebas de contraste de hiptesis:
- Comparacin de medias con la t de Student
- Test exacto de Fisher,
- Test de chi-cuadrado 2
- Anlisis de la varianza (ANOVA)
- Test de Wilcoxon
- Coeficiente de Spearman

Med Clin (Barc) 2003; 121 (20): 793-8.

Pgina 1023

C aptulo 11

Evaluacin de mtodos diagnsticos cuantitativos


- Variacin metrolgica.

Errores aleatorios.

Errores sistemticos.
- Comparacin de mtodos.

Pgina 1024

C aptulo 11

Evaluacin metrolgica
La evaluacin metrolgica de una prueba diagnstica CUANTITATIVA
persigue detectar los errores aleatorios y sistemticos que origina,
para cuantificarlos mediante clculos estadsticos y determinar si son
inferiores a los lmites permisibles que no comprometen a la utilizacin
clnica de los resultados.
Esta evaluacin nos permite conocer el error que cometemos en
nuestras condiciones de trabajo, y si el la prueba es adecuada para
nuestros fines o es necesario cambiarlo por otros mtodos.

Pgina 1025

C aptulo 11

INTRASERIAL

ERRORES ALEATORIOS

EXPERIMENTOS DE
REPLICACIN
INTERSERIAL

EVALUACIN METROLGICA
CONSTANTES

EXPERIMENTOS DE
REPLICACIN

ERRORES SISTEMTICOS
PROPORCIONALES

EXPERIMENTOS DE
REPLICACIN

Pgina 1026

C aptulo 11

Variacin
metrolgica

CVa =

SD

* 100

X
Error aleatorio

Error sistemtico

Inexactitud y imprecisin
Inexactitud y precisin

Exactitud y imprecisin
Exactitud y precisin

Pgina 1027

C aptulo 11

Especificaciones de la calidad para la imprecisin analtica

Prestacin ptima

CVa < CVBw

Prestacin deseable

CVa < CVBw

Prestacin mnima

CVa < CVBw

Pgina 1028

C aptulo 11

Fuentes de variacin biolgica


- Variacin biolgica NO aleatoria
- A lo largo de la vida
- Ritmo biolgico diario
- Ciclos mensuales
- Ritmos estacionales
- Variacin biolgica aleatoria
- Variacin biolgica intra-individual (CVBw)
- Variacin biolgica inter-individual (CVBb)

Pgina 1029

C aptulo 11

Fuentes de variacin biolgica

Concentracin relativa

Colesterol

Urea

Fsforo

20

30

40

50

60

Edad en aos

70

Pgina 1030

C aptulo 11

Variacin de los niveles de Colesterol total


Distribucin por grupos socioculturales
Colesterol total (mg/dl)
185
175
165
155
145
135
125

CRISTIANOS
1

1,5

MUSULMANES
7

EDAD (aos)

10

11

12

13

Pgina 1031

C aptulo 11

Ritmo biolgico circadiano


Cortisol nmol/L

GH

600

mU/L

GH

300

9:00 horas

Cortisol

24:00

Tiempo

9:00

Pgina 1032

C aptulo 11

Clculo de la variacin total (CVt)


Cuando se obtiene una sola muestra y esta es analizada una sola vez....

CVt =

CVp2 + CVa2 + CVBw2

Variacin
preanaltica

Variacin
analtica

Variacin
biolgica
intraindividual

Pgina 1033

C aptulo 11

Pgina 1034

Si minimizamos la variabilidad preanaltica mediante protocolizacin, entrenamiento,


buenas prcticas de laboratorio y seguimiento de los procedimientos operativos descritos y
estandarizados....

CVt =

CVa2 + CVBw2

Variacin
analtica

Variacin
biolgica
intraindividual

C aptulo 11

Variabilidad biolgica aleatoria


Lmite de referencia superior

Lmite de referencia superior

CVBw = 4,3

Mediana
Punto
de ajuste
homeost
homeosttico
tico

Lmite de referencia inferior

Creatinemia (mg/dl)

Creatinemia (mg/dl)

CVBb = 18,3

Lmite de referencia inferior

Pgina 1035

C aptulo 11

ndice de individualidad (II)

II > 0,6

CVBw > CVBb


Escasa individualidad
Diagnstico
Intervalos de referencia poblacionales

CVBw
CVBb

II < 0,6

CVBw < CVBb


Fuerte individualidad
Seguimiento
Diferencia crtica

Pgina 1036

C aptulo 11

DC = 2 * Z [CVBw2 + CVa2]
Cambio significativo con probabilidad del 95% (Z=1.96)

DC95 = 2,77 [CVBw2 + CVa2]


Cambio significativo con probabilidad del 99% (Z=2.58)

DC99 = 3,65 [CVBw2 + CVa2]

Pgina 1037

C aptulo 11

Varn de 63 aos con hipertensin y una concentracin de colesterol total de 254 mg/dl,
la cual tras modificar sus hbitos de vida (tratamiento diettico) cambi a 224 mg/dl.
Cunto ha cambiado la colesterolemia?

Variacin
porcentual

CT final
=

- CT inicial

CT inicial

- 11,8%

Ha cambiado significativamente la colesterolemia?

Pgina 1038

C aptulo 11

Pgina 1039

Interpretacin del cambio aplicando criterios basados en la


variabilidad biolgica
Variacin biolgica: de la teora a la prctica
Callum G. Fraser

Ninewells Hospital and medical School. Dundee. Scotland. 2001.

C aptulo 11

Ha cambiado significativamente la colesterolemia?

Cambio significativo con probabilidad del 95% (Z=1.96)(p<0,05)

DC95 = 2,77 [CVBw2 + CVa2]

DC = 19%

Cambio significativo con probabilidad del 99% (Z=2.58)(p<0,01)

DC99 = 3,65 [CVBw2 + CVa2]

DC = 24,5%

Pgina 1040

Probabilidad estadstica de cambio P(%) Z

C aptulo 11

99% (p<0,01)
95% (p<0,05)
90% (p<0,1)
82%

11,8%

15,6%

19%

24,5%

Dc Cambio en la colesterolemia (%)

Pgina 1041

C aptulo 11

Comparacin de mtodos
Diagnsticos cuantitativos
1. Mtodos analticos
2. Mtodos de regresin
3. Mtodos grficos

Pgina 1042

C aptulo 11

Pgina 1043

Comparacin de mtodos
Diagnsticos cuantitativos
- Se utiliza para demostrar que el nuevo mtodo (Y) presenta una buena
concordancia con el mtodo clsico de referencia (X).
- Demostrar que una misma medida tiene equivalencia con diferentes
equipos.
- Detectar la presencia de SESGOS (errores sistemticos):
- Error (sesgo) constante.
- Error (sesgo) proporcional.

C aptulo 11

Error (sesgo) constante

Mtodo Y

La diferencia entre
ambos mtodos se
mantiene constante a
lo largo del rango de
medidas

Mtodo X

Pgina 1044

C aptulo 11

Error (sesgo) proporcional

Mtodo Y

La diferencia entre
ambos mtodos se
lineal a lo largo de
todo el largo del rango
de medicin.

Mtodo X

Pgina 1045

C aptulo 11

Comparacin de mtodos diagnsticos cuantitativos


- Si los errores sistemticos detectados y medidos estn en un lmite aceptable,
la evaluacin se debe completar con un experimento de comparacin de
mtodos frente a los resultados obtenidos con un mtodo de referencia.
- La utilizacin de la estadstica en los experimentos de comparacin de mtodos
es la parte ms difcil del anlisis estadstico en los estudios de evaluacin de
mtodos.
- Qu mtodo estadstico es el que comete menos error para calcular el error
que comete un mtodo analtico?

Pgina 1046

C aptulo 11

Anlisis de concordancia: variables cuantitativas


Mtodos diagnsticos
- Coeficiente de correlacin intraclase (ANOVA).
- Modelo de efectos ALEATORIOS.
- Modelo de efectos FIJOS.
- Coeficiente de correlacin-concordancia de Lin.
- Concordancia de Krippendorff.

Pgina 1047

C aptulo 11

Anlisis de concordancia: variables cuantitativas


Mtodos de regresin
- Mtodo de regresin lineal por mnimos cuadrados.
- Mtodo de regresin ortogonal de Deming.
- Modelo de Passing-Bablock.
- Mtodo de mnimos cuadrados ponderado.
- Mtodo de regresin de Bland y Altman.
- ANOVA de medidas repetidas.
- Modelos de ecuaciones estructurales.

Pgina 1048

C aptulo 11

Anlisis de concordancia: variables cuantitativas


Mtodos grficos
- Anlisis de las diferencias individuales mtodo de Bland y Altman (que calcula
un intervalo de concordancia),
- Grfico de distribucin acumulativa emprica grfico montaa (mountain
plot)
- Grfico de la concordancia- supervivencia (survival-agreement plot).

Pgina 1049

C aptulo 11

Pgina 1050

Cul es el mtodo estadstico ms adecuado para calcular


el error que comete un mtodo diagnstico cuantitativo?
La utilizacin de la estadstica en los experimentos de comparacin de mtodos
cuantitativos es la parte ms difcil del anlisis estadstico en los estudios de
evaluacin de mtodos diagnsticos.

C aptulo 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico por el
nuevo sistema digital para la medida de la tensin arterial?

Sistema analgico

Sistema digital

Cul es el test estadstico ms acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

Pgina 1051

C aptulo 11

Pgina 1052

Regresin lineal por mnimos cuadrados:


Condiciones de aplicacin(*)
1. Linealidad de datos.
2. Pequeos errores aleatorios.
3. Intervalo de valores normales suficientemente amplio de concentraciones.
4. Ausencia de valores aberrantes (outliers).
5. Que la variable PREDICTORA X no tenga error, es decir que el mtodo de
referencia utilizado sea exacto, pero en la mayora de ocasiones no es posible, por lo
que los resultados del mtodo de comparacin (X) tambin presenta errores.

(*) Westgard JO, Hunt MR. Use and interpretation of common statistical test in method-comparison studies.
Clin Chem 1973; 19: 44-57.

C aptulo 11

Mtodo digital

Medidas de tensin arterial sistlica en un


grupo de 30 pacientes mediante dos
mtodos de medicin (tradicional y
automatizado)

Error sistemtico
proporcional
Mtodo analgico

Pgina 1053

C aptulo 11

Se representan los datos de un estudio en el que se tom la tensin arterial sistlica


en 30 pacientes utilizando dos mtodos diferentes. Se representan grficamente estos
datos, indicando el coeficiente de correlacin lineal de Pearson r=0,997 (p<0,0001) una
asociacin prcticamente lineal.
Para variables cuantitativas, es frecuente que el anlisis de la concordancia entre dos
medidas de la misma variable se realice ERRNEAMENTE mediante el clculo del
coeficiente de correlacin de lineal (r) de Pearson como ndice de concordancia.

Bland JM, Altman DG. Statistical methods for assesing agreement between two methods of clinical
measurement. Lancet 1986; 1: 307-310.

Pgina 1054

C aptulo 11

Regresin lineal por mnimos cuadrados:


Variable Y

DIGITAL

Variable X

ANALGICO

Tamao de muestra

30

Coeficiente de determinacin R

Ecuacin de regresin

0,9940
Y = 5,8672 + 0,9351 X

Parmetro Coeficiente Error estndar IC95%

5,8672

1,9830

1,8053-9,9291

2,9588

0,0062

0,9351

0,01369

0,9071-0,9632

66,295

< 0,0001

Pgina 1055

C aptulo 11

Pgina 1056

Coeficiente de correlacin de Pearson


- Mide la fuerza de asociacin entre ambas variables (X-Y), es decir
la intensidad de la relacin lineal entre los dos mtodos diagnsticos
cuantitativos.
- No ofrece informacin sobre el grado de CONCORDANCIA, por tanto no
puede detectar sesgo constante o proporcional.
- Es posible encontrar un alto coeficiente de correlacin con una baja
intensidad de concordancia entre mtodos.

CORRELACIN CONCORDANCIA

C aptulo 11

Pgina 1057

Mito 1: La sonrisa de la esfinge


Por qu has elegido el coeficiente de correlacin de Pearson? Se cumplen todos
los requisitos para poder utilizarlo?Te permite ese test decir que los resultados son
intercambiables entre ambos instrumentos de medida?
El coeficiente de correlacin de lineal (r) de Pearson NO resulta una medida adecuada del
grado de acuerdo o concordancia entre dos mediciones de un mismo parmetro (presin
arterial), ya que si dos instrumentos miden sistemticamente cantidades diferentes uno del
otro, la correlacin puede ser perfecta (r 1), a pesar de que la concordancia sea nula.
El coeficiente de correlacin r de Pearson deca que la magnitud de la asociacin de la
medida de la presin arterial entre el mtodo manual A y el mtodo digital B es del 99,7
(r=0,997) de la mxima posible.

C aptulo 11

Pgina 1058

Coeficiente de correlacin intraclase


- Los valores del CCI pueden oscilar entre 0 y 1, de modo que la mxima
concordancia posible corresponde a un valor de CCI=1.
- Cuando el valor CCI=0 se obtiene cuando la concordancia observada es
igual a la que se esperara que ocurriera slo por AZAR. En este caso la
variabilidad observada se explicara por las discrepancias entre los mtodos
de medicin o de los diferentes criterios utilizados por los observadores en
el experimento.
CORRELACIN CONCORDANCIA

Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of clinical
measurement. Lancet 1986;8:307-10.
Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

C aptulo 11

Pgina 1059

Coeficiente de correlacin intraclase


- La obtencin del CCI que permite evaluar la concordancia general entre dos o ms
mtodos u observaciones diferentes se basa en un modelo de anlisis de la variancia
(ANOVA) con medidas repetidas, pero su obtencin directa no es posible con los paquetes
estadsticos habituales.
- La variabilidad total observada en el CCI puede dividirse en tres componentes:
- La variabilidad debida a las diferencias entre los pacientes (2P);
- La variabilidad debida a las diferencias entre los observadores (mdicos A y B)
(2O), y
- La variabilidad (residual), inexplicable (aleatoria), asociada al error inherente a toda
medicin (2R).
- El CCI se define como la proporcin de variabilidad total debida a la variabilidad de los
pacientes:
CCI =

2P
2P + 2O + 2R

C aptulo 11

Coeficiente de correlacin intraclase


- Los valores del CCI pueden oscilar entre 0 y 1: donde el 0 indica ausencia de
concordancia y el 1, la concordancia o fiabilidad absoluta de los resultados obtenidos.
- Si bien el valor del CCI que define una fiabilidad satisfactoria es arbitrario (criterios de
Fleiss):
- CCI < 0,4 representan BAJA fiabilidad.
- CCI entre 0,4 - 0,75 representan una fiabilidad entre REGULAR y BUENA.
- CCI > 0,75 representan una fiabilidad EXCELENTE.
Fleiss JL. The design and analysis of clinical experiments. Nueva York: John Wiley
& Sons, Inc., 1986.
- Los resultados ofrecidos por la r de Pearson para estos propsitos pueden resultar
equvocos.
- Se recomienda el uso del CCI para cuantificar la fiabilidad de las mediciones clnicas.

Pgina 1060

C aptulo 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico por el
nuevo sistema digital para la medida de la tensin arterial?

Sistema analgico

Sistema digital

Cul es el test estadstico ms acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

Pgina 1061

C aptulo 11

Pgina 1062

Coeficiente de correlacin intraclase


Ejemplo
- En este caso CCI=0.991, casi toda la variabilidad observada no depende
de las diferencias en los mtodos de medicin empleados o los diferentes
observadores (tan slo el 0,9%).
- Es decir, slo el 0,9% de la variabilidad observada es debida a las
discrepancias o diferencias entre los mtodos de medicin o por el diferente
criterios utilizados por los observadores.
Sistema analgico

Sistema digital

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

C aptulo 11

Coeficiente de correlacin intraclase


Clculo del CCI mediante programas estadsticos

Parmetro

Correlacin intraclase

IC95%

Medidas individuales

0,9911

0,9398 a 0,9971

Medidas promedio

0,9955

0,9690 a 0,9986

Pgina 1063

C aptulo 11

Valoracin del Coeficiente de correlacin intraclase


Valoracin de la concordancia segn los valores de Coeficiente
de Correlacin Intraclase (CCI)
CCI

Fuerza de la concordancia

> 0,90

Muy buena

0,71 - 0,90

Buena

0,51 - 0,70

Moderada

0,31 - 0,50

Mediocre

< 0,30

Mala o nula

Pgina 1064

C aptulo 11

Pgina 1065

Modelo de efectos aleatorios


Este modelo aleatorio es apropiado cuando los observadores implicados en la medicin,
las enfermeras A y B en el ejemplo, representan una muestra aleatoria de la poblacin
de posibles observadores (p. ej, otras enfermeras del hospital) que en el futuro harn uso
del instrumento evaluado (el esfigmomanmetro).

Luis Prieto, Rosa Lamarca, Alfonso Casado. La evaluacin de la fiabilidad en las observaciones clnicas: el
coeficiente de correlacin intraclase. Med Clin (Barc). 1998;110:142-5.

C aptulo 11

Se desea evaluar la concordancia entre las medidas de tensin arterial entre dos
enfermeras A y B mediante la comparacin de los resultados de dos mediciones
consecutivas de la presin arterial sistlica en 10 pacientes, realizadas en el mismo
esfingomanmetro por dos enfermeras.

ENFERMERA A

Cul es el test estadstico ms acertado?

ENFERMERA B

Pgina 1066

C aptulo 11

Pgina 1067

Comparacin de dos mediciones consecutivas de la presin arterial


sistlica en 10 pacientes, realizadas en el mismo esfingomanmetro por dos
enfermeros diferentes.
Paciente

Enfermera A

Enfermera B

Diferencia (B-A)

135

140

140

145

130

135

145

150

140

145

150

160

10

140

145

135

140

140

145

10

135

145

10

Media

139

145

DE

5,68

6,67

2,11

C aptulo 11

150

Pearson
r = 0,954

ENFERMERA A

145

r2 =

0,910

Rho Spearman
r = 0,929
p < 0,01

p < 0,01
140

135

130
130

135

140

145

ENFERMERA B

150

160

Pgina 1068

C aptulo 11

160

Pearson
r = 0,954

150

ENFERMERA B

145

r2 = 0,910
p < 0,01

140

Rho Spearman
r = 0,929
p < 0,01

135

130

ENFERMERA A
130

135

140

145

150

Pgina 1069

C aptulo 11

160

Pearson

Error
sistemtico
constante

r = 0,954
150

ENFERMERA B

145

r2 = 0,910
p < 0,01

140

Rho Spearman
r = 0,929
p < 0,01

135

130

ENFERMERA A
130

135

140

145

150

160

Pgina 1070

C aptulo 11

Pgina 1071

T de Student para datos apareados:


1. Mide la diferencia entre las medias de las mediciones realizadas por los dos
mtodos comparados.
2. Slo puede detectar el sesgo o error sistemtico constante.
3. No puede detectar el error sistemtico PROPORCIONAL.

Gardner PL. Measuring attitudes to science: Unidimensionality and internal consistency revisited. Research
in Science Education 1995; 25: 283-9.

C aptulo 11

Resultados
Variables

Media

Desviacin
estndar (s)

Error estndar de
la media (EEM)

ENFERMERA A

139,0

10

5,678

1,795

ENFERMERA B

145,0

10

6,667

2,108

Variable

Correlacin (r)

Significacin

ENFERMERA A versus ENFERMERA B

10

0,954

0,000

Variables

Enfermera B Enfermera A

Diferencias relacionadas Intervalo de


confianza de la
diferencia

t calculada

gl

Significacin
bilateral

Media

EEM

Inferior

Superior

9,000

0,000

6,00

2,108

0,667

4,492

7,508

t calculada > t tabulada

p<0,05 (rechazamos la hiptesis nula)

La t de Student para datos apareados permite detectar el sesgo o error sistemtico CONSTANTE.

Pgina 1072

C aptulo 11

CCI =

2P
2P + 2O + 2R

Frmula simplificada del coeficiente de correlacin intraclase (CCI)


para un MODELO de EFECTOS ALEATORIOS

CCI =

( DEA )2 + ( DEB )2 - ( DEB-A )2


( DEA )2 + ( DEB )2 + ( XB-A )2 - ( DEB-A )2/ n
Clculo del CCI del ejemplo anterior:

CCI =

( 5,68 )2 + ( 6,67 )2 - ( 2,11 )2


( 5,68 )2 + ( 6,67 )2 + ( 6 )2 - ( 2,11 )2 / 10

= 0,64

Pgina 1073

C aptulo 11

Coeficiente de correlacin intraclase


Clculo del CCI mediante programas estadsticos

Parmetro

Correlacin intraclase

IC95%

Medidas individuales

0,6436

- 0,0488 a 0,9240

Medidas promedio

0,7831

- 0,1027 a 0,9695

Pgina 1074

C aptulo 11

Valoracin del Coeficiente de correlacin intraclase


Valoracin de la concordancia segn los valores de Coeficiente
de Correlacin Intraclase (CCI)
CCI

Fuerza de la concordancia

> 0,90

Muy buena

0,71 - 0,90

Buena

0,51 - 0,70

Moderada

0,31 - 0,50

Mediocre

< 0,30

Mala o nula

Pgina 1075

C aptulo 11

Pgina 1076

Conclusiones
- El valor del CCI obtenido es claramente inferior al valor 0,954 obtenido
con la r de Pearson, demostrando que la existencia de una alta asociacin
entre dos variables no es necesariamente signo de una alta concordancia.
- Aplicando la frmula a los datos anteriores, se obtiene un CCI igual
a 0,64, lo que indica una concordancia moderada entre los resultados
obtenidos por las enfermeras A y B.

CORRELACIN CONCORDANCIA

C aptulo 11

Pgina 1077

Modelo de efectos fijos


- Este modelo es apropiado cuando los observadores que intervienen en el
estudio son los nicos que participarn en el mismo.
- Se utiliza cuando el objetivo es conocer la magnitud de las discrepancias
entre dos mdicos y determinar si el mdico A puede ser sustituido por el
mdico B en esa tarea.
- Slo estamos interesados en la comparacin de los resultados obtenidos por
estos 2 mdicos y no desearemos generalizar los resultados al conjunto de
mdicos que miden la frecuencia cardaca en el hospital.

C aptulo 11

Se desea valorar la concordancia de las mediciones de la FRECUENCIA


CARDACA obtenidas en 10 pacientes por 2 mdicos diferentes: un mdico A, jefe
del servicio, y un mdico B, en perodo de formacin. El objetivo es conocer la
magnitud de las discrepancias entre ambos y determinar si el mdico A puede ser
sustituido por el mdico B en esa tarea.

El pulso radial se siente mejor en la


mueca, debajo del pulgar.

JEFE DE SERVICIO

Cul es el test estadstico ms acertado?

MDICO RESIDENTE

Pgina 1078

C aptulo 11

Comparacin de dos mediciones consecutivas de la FRECUENCIA


CARDACA en pulsaciones por minuto (ppm) en 10 pacientes realizada por
dos mdicos diferentes: un mdico A, jefe del servicio, y un mdico B en
periodo de formacin (modelo de EFECTOS FIJOS).
Paciente

Mdico A

Medico B

Diferencia (B-A)

75

80

74

84

10

76

81

79

83

82

92

10

83

88

85

90

87

92

87

92

10

88

93

Media

81,6

87,5

5,9

DE

5,3

5,04

2,18

Pgina 1079

C aptulo 11

MEDICO RESIDENTE

95

90

Pearson
r = 0,912
r2 = 0,832
p < 0,01

85

80

Rho Spearman
r = 0,855
p = 0,002

75
75

80

RESIDENTE = 16,7 + 0,868 * JEFE

85

90

95

JEFE DE SERVICIO

Pgina 1080

C aptulo 11

MEDICO RESIDENTE

95

Error sistemtico
constante

90

85

80

75
75

80

RESIDENTE = 16,7 + 0,868 * JEFE

85

90

95

JEFE DE SERVICIO

Pgina 1081

C aptulo 11

CCI =

2P
2P + 2O + 2R

Frmula simplificada del coeficiente de correlacin intraclase (CCI)


para un MODELO de EFECTOS FIJOS

CCI =

( DEA )2 + ( DEB )2 - ( DEB-A )2


( DEA )2 + ( DEB )2 + ( XB-A )2 / 2 - ( DEB-A )2 / 2n
Clculo del CCI del ejemplo anterior:

CCI =

( 5,3 )2 + ( 5,04 )2 - ( 2,18 )2


( 5,3 )2 + ( 5,04 )2 + ( 5,9 )2 / 2 - ( 2,18 )2 / 2 x 10

= 0,69

Pgina 1082

C aptulo 11

Valoracin del Coeficiente de correlacin intraclase


Valoracin de la concordancia segn los valores de Coeficiente
de Correlacin Intraclase (CCI)
CCI

Fuerza de la concordancia

> 0,90

Muy buena

0,71 - 0,90

Buena

0,51 - 0,70

Moderada

0,31 - 0,50

Mediocre

< 0,30

Mala o nula

Pgina 1083

C aptulo 11

Pgina 1084

Conclusiones
A pesar de que la r de Pearson indica una alta asociacin (r = 0,912),
aplicando la frmula a los datos anteriores, se obtiene un CCI igual a 0,69,
lo que indica una concordancia moderada entre los resultados obtenidos
por los mdicos A y B.

CORRELACIN CONCORDANCIA

C aptulo 11

Pgina 1085

Limitaciones del coeficiente de correlacin intraclase


A pesar de ser la medida de concordancia ms adecuada para el caso de variables
NUMRICAS, el CCI presenta ciertas limitaciones:
1. A la hora de interpretar los valores del CCI, la clasificacin de la tabla 5 es subjetiva.
2. Dificultad inherente a su clculo.
3. Se trata de una prueba PARAMTRICA, por lo que limita su uso a:
- variables distribuidas segn una normal.
- igualdad de varianzas.
- independencia entre los errores de cada observador.
4. El CCI depende en gran medida de la variabilidad de los valores observados: cuanto
ms homognea sea la muestra estudiada, ms bajo tender a ser el valor del CCI.
5. Lo que ms ha limitado la difusin del uso del CCI en la literatura mdica es la carencia
de interpretacin clnica completamente objetiva.

Prieto L, Lamarca R, Casado A. La evaluacin de la fiabilidad en las observaciones clnicas: el coeficiente


de correlacin intraclase. Med Clin (Barc) 1998;110:142-5.

C aptulo 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico por el
nuevo sistema digital para la medida de la tensin arterial?

Sistema analgico

Sistema digital

Cul es el test estadstico ms acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

Pgina 1086

C aptulo 11

Medidas de tensin arterial sistlica en un


grupo de 30 pacientes mediante dos mtodos
de medicin (tradicional y automatizado)

Mtodo digital

Error sistemtico
proporcional

Mtodo analgico

Pgina 1087

C aptulo 11

Pgina 1088

Coeficiente de concordancia de Lin


- El coeficiente de correlacin de las medidas de concordancia de LIN mide el
grado de acuerdo entre dos variables cuantitativas continuas.
- Es til para evaluar la reproducibilidad o fiabilidad entre dos observadores o
evaluadores.
Escala de McBrige para el coeficiente de
concordancia de Lin
Valor de la c

Fuerza de acuerdo

< 0,90

Pobre

0,90 0,95

Moderada

0,95 0,99

Sustanciales

> 0,99

Casi perfecto

C aptulo 11

Coeficiente de concordancia de Lin


Variable Y

DIGITAL

Variable X

ANALGICO

Tamao de muestra

30

Coeficiente de CONCORDANCIA de Lin

0,9908

Intervalo de confianza al 95%

0,9832 a 0,9949

Pearson (precisin)

0,9970

Factor de correccin del sesgo C b (exactitud)

0,9937

Pgina 1089

C aptulo 11

Se desea evaluar la concordancia entre las medidas de tensin arterial entre dos
enfermeras A y B mediante la comparacin de los resultados de dos mediciones
consecutivas de la presin arterial sistlica en 10 pacientes, realizadas en el mismo
esfingomanmetro por dos enfermeras.

ENFERMERA A

Cul es el test estadstico ms acertado?

ENFERMERA B

Pgina 1090

C aptulo 11

Coeficiente de concordancia de Lin


Variable Y

Enfermera A

Variable X

Enfermera B

Tamao de muestra

10

Coeficiente de CONCORDANCIA de Lin

0,6190

Intervalo de confianza al 95%

0,3074 a 0,8107

Pearson (precisin)

0,9542

Factor de correccin del sesgo C b (exactitud)

0,6487

Pgina 1091

C aptulo 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico por el
nuevo sistema digital para la medida de la tensin arterial?

Sistema analgico

Sistema digital

Cul es el test estadstico ms acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

Pgina 1092

C aptulo 11

Pgina 1093

Mtodo de regresin ortogonal de Deming


1. En el caso de que presenten errores aleatorios en el mtodo de referencia (X) ha sido
propuesto como ms aceptable el mtodo de regresin ortogonal establecido por Deming
en 1943 (*).
2. Es adecuado incluso si existen valores aberrantes (**).
3. Si el error que presenta esta variable es proporcional, cuando la varianza de los
resultados aumenta con la concentracin, ha sido considerado adecuado el clculo de la
correlacin lineal mediante el clculo de mnimos cuadrados ponderado.
4. Mientras que consideran mejor el mtodo de Deming si los errores en x son
significativos frente al intervalo ensayado, cuando el intervalo de concentraciones es
estrecho (v.g. en Potasio) (***).
(*) Wakkers PJM, Hallendoorn HBA, Op de Weegh GJ, Heerspink W. Applications of statistics in clinical
chemistry. A critical evaluation of regression lines. Clin Chim Acta 1975; 64: 173-84.
(**) Cornbleet PJ, Gochman N. Incorrect least-squares regression coefficients in method-comparison
analysis. Clin Chem 1979; 25: 432-38.
(***) Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended linear regressin models for
comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.

C aptulo 11

Representacin grfica de Deming

Error sistemtico
proporcional

Pgina 1094

C aptulo 11

Mtodo de regresin ortogonal de Deming


Variable Y

DIGITAL

Variable X

ANALGICO

Tamao de muestra

30

Ecuacin de regresin

Y = 5,4741 + 0,9379 X

Mtodo

Media

Coeficiente de variacin (CV%)

140,23

26,24

137,00

25,19

Parmetro

Coeficiente

Error estndar

IC95%

5,4741

1,7780

1,8377-9,1106

0,9379

0,01275

0,9124-0.9634

Pgina 1095

C aptulo 11

Representacin grfica de los residuales de Deming

Pgina 1096

C aptulo 11

Modelos de regresin de Passing-Bablock


- En los aos 80-90, para evitar los inconvenientes del mtodo simple de mnimos
cuadrados, Passing y Bablok desarrollan el clculo del mtodo de regresin no
paramtrica.
- Fue defendido como mtodo de eleccin debido a su robustez y a permitir obtener
una estimacin no sesgada de la recta de regresin.

Frey E, Fuentes-Arderiu X, Queralt JM. Comparacin estadstica de mtodos analticos. Educacin


continuada Qumica Clnica. 1988; 1:
69-79.

Pgina 1097

C aptulo 11

Pgina 1098

Modelos de regresin de Passing-Bablock


Condiciones y limitaciones de aplicacin
1. La razn de varianzas en Y y X iguale el cuadrado de la pendiente.
2. Ausencia de error en la variable PREDICTORA (independiente) X.
3. Que el error en la variable RESULTADO Y debe ser homogneo en todo el intervalo
de concentraciones.

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.

C aptulo 11

Modelos de regresin de Passing-Bablock


Variable Y

DIGITAL

Variable X

ANALGICO

Tamao de muestra

30

Ecuacin de regresin

Y = 5,9375 + 0,9375 X

Parmetro

Coeficiente

IC95%

5,9375

1,4912-9,5455

0,9375

0,9091-0,9649

Test de linealidad de
suma acumulada

p < 0,10

No existe desviacin significativa de la linealidad

Pgina 1099

C aptulo 11

Pgina 1100

C aptulo 11

Se puede utilizar el mtodo de Passing-Bablock?

Sy 2

= [ 1 ]2

Sx 2
1190,69
1353,56

S.

= 0,8796

[ 0,9375 ]2 = 0,8789

Pgina 1101

C aptulo 11

Pregunta de investigacin
El objetivo de este estudio ha sido analizar la concordancia entre dos mtodos enzimticos de determinacin de la
AMILASA srica perteneciente a una misma casa comercial
y basados en el mismo principio fsico-qumico.
Amilasa antigua

Cul es el test estadstico ms acertado?

Amilasa nueva

Pgina 1102

C aptulo 11

Modelos de regresin de Passing-Bablock


Variable Y

AMILASA NUEVA

Variable X

AMILASA CLSICA

Tamao de muestra

548

Ecuacin de regresin

Y = 4,6190 + 0,8095 X

Parmetro

Coeficiente

IC95%

4,6190

4,000-5,200

0,8095

0,8000-0,8182

Test de linealidad de
suma acumulada

p < 0,01

Desviacin significativa de la linealidad

Pgina 1103

C aptulo 11

Error sistemtico
proporcional

Pgina 1104

C aptulo 11

CVa (nueva) = 152%

CVa =

SD
X

* 100

CVa (clsica) = 148%

NO SE PUEDE UTILIZAR el mtodo de Regresin ortogonal de Deming


porque los CV > 100%.

Pgina 1105

C aptulo 11

Se puede utilizar el mtodo de Passing-Bablock?

Sy 2

= [ 1 ]2

Sx 2
14508
18695
No.

= 0,7060

[ 0,8095 ]2 = 0,6553

Pgina 1106

C aptulo 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico por el
nuevo sistema digital para la medida de la tensin arterial?

Sistema analgico

Sistema digital

Cul es el test estadstico ms acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

Pgina 1107

C aptulo 11

Pgina 1108

Mtodo de mnimos cuadrados ponderado


- En 1991 Zaydman et al., en su estudio sobre modelos de regresin lineal para
comparacin de mtodos, rechazan el mtodo de Passing-Bablok porque no cumple las
condiciones anteriores.
- Obtienen los mejores resultados con el mtodo de mnimos cuadrados ponderado
cuando los errores en la variable PREDICTORA X son pequeos frente al intervalo de
concentraciones como el medido (v.g. en Glucosa).

C aptulo 11

Mtodo de mnimos cuadrados ponderado

EE

0,935
0,014

= 66,76 >> Z95% (1,96)


Z99,5% (3,29)

p < 0,05
p < 0,005

Pgina 1109

C aptulo 11

Pregunta de investigacin
El objetivo de este estudio ha sido analizar la concordancia entre dos mtodos enzimticos de determinacin de la
AMILASA srica perteneciente a una misma casa comercial
y basados en el mismo principio fsico-qumico.
Amilasa antigua

Cul es el test estadstico ms acertado?

Amilasa nueva

Pgina 1110

C aptulo 11

Mtodo de mnimos cuadrados ponderado

Pgina 1111

C aptulo 11

Pgina 1112

Mtodo grfico de Bland y Altman


- Bland y Altman proponen su mtodo de evaluacin de las diferencias, con el atractivo de
su sencillez de clculo y su utilizacin frente al uso de los mtodos de regresin anteriores.
- Representan grficamente la diferencia entre los dos mtodos (D = Y X) frente a la
media de la suma de los dos resultados (A = X + Y / 2).

Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison studies. The
Statistician 1983; 32, 307-317.
Lpez, F. Utilizacin adecuada de las pruebas estadsticas en los estudios de comparacin de
procedimientos. Quim Clin 2000; 19: 237.

C aptulo 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico de gran tamao
por el sistema mini porttil para la medida del flujo respiratorio mximo (FEM)?
Clsico grande

Mini porttil

Cul es el test estadstico ms acertado?

Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison studies. The
Statistician 1983; 32, 307-317.

Pgina 1113

C aptulo 11

GRANDE 1 Medida

GRANDE 2 medida

MINI 1 medida

MINI 2 medida

494

490

512

525

395

397

430

415

516

512

520

508

434

401

428

444

476

470

500

500

557

611

600

625

413

415

364

460

442

431

380

390

650

638

658

642

10

433

429

445

432

11

417

420

432

420

12

656

633

626

605

13

267

275

260

227

14

478

492

477

467

15

178

165

259

268

16

423

372

350

370

17

427

421

451

443

Pgina 1114

Se midi el flujo respiratorio mximo (FEM) en una muestra de 17 individuos con un amplia gama de FEM. Se
realizaron 2 mediciones en cada instrumento (grande clsico y Mini portatil). Slo la 1 medida de cada aparato
se utiliz para la comparacin de los mtodos, la 2 medicin se utiliz en el estudio de la repetibilidad.

C aptulo 11

Generalmente los puntos de datos se agrupan cerca de la lnea y


es difcil evaluar las diferencias entre los mtodos comparados

Sistema portatil Mini (l/min)

800

r = 0,9433; p <0,0001
600

400

200

0
0

200

400

600

800

Sistema clsico grande Flujo respiratorio (l/min)

Pgina 1115

C aptulo 11

Pgina 1116

C aptulo 11

Pgina 1117

Mtodo grfico de Bland y Altman: Interpretacin


- En el caso de que no haya error sistemtico los puntos se distribuirn de forma aleatoria
a uno y otro lado de la recta correspondiente a la diferencia 0 entre medidas (lnea
horizontal naranja).
- La lnea azul representa la media de las diferencias, que en nuestro ejemplo corresponde
a 2,1 (error sistemtico del segundo mtodo respecto al primero).
- Las lneas marrones representan los lmites de confianza definidos mediante 2 DE de
la media de la diferencia, y se denominan lmites de concordancia

Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison studies. The
Statistician 1983; 32, 307-317.
Bland JM, Altman DG . Statistical methods for assessing agreement between two methods of clinical
measurement. Lancet 1986: 307310.

C aptulo 11

Pgina 1118

Reflexiones del grfico


- Se observa una considerable falta de concordancia entre los medidores grandes y mini,
con discrepancias de hasta 80 l/min.
- Siempre que las diferencias d 2s no sean clnicamente importantes podamos asumir
que los mtodos de medicin son intercambiables. Estas d 2s son los lmites de
acuerdo.
- Para los datos de FEM se tiene:
d - 2s = -2,1 - (2 * 38,8) = - 78,1 l / min
d + 2s = -2,1 + (2 * 38,8) = - 73,9 l / min
- El medidor Mini ofrece datos de hasta 80 l / min por debajo o de 76 l / min por encima del
medidor grande, lo que es inaceptable para los propsitos clnicos.
- Esta falta de concordancia NO es evidente en la figura de correlacin lineal de FEM.

C aptulo 11

Pgina 1119

Ensayo de repetibilidad
- La repetibilidad es relevante para el estudio de comparacin de mtodos porque la
repetibilidad de los mtodos de medida limita el grado de concordancia.
- Si un mtodo presenta una repetibilidad pobre - es decir, existe una considerable
variacin en las mediciones repetidas en la misma muestra - el grado de concordancia
entre ambos mtodos es pobre tambin.
- La mejor manera de examinar la repetibilidad de un instrumento es tomar medidas
repetidas en una serie de muestras.
- Se calcula la media y la desviacin estndar de la diferencias medidas. La diferencia
media debe ser cero, ya que se trata del mismo mtodo. Si la diferencia de medias
es significativamente diferente de cero, no podemos utilizar los datos para evaluar la
repetibilidad, ya sea porque el conocimiento de la 1 medida est afectando a la 2 o el de
la medida es modificar la cantidad).

C aptulo 11

Ensayo de repetibilidad en el Mini

Pgina 1120

C aptulo 11

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico por el
nuevo sistema digital para la medida de la tensin arterial?

Sistema analgico

Sistema digital

Cul es el test estadstico ms acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.

Pgina 1121

C aptulo 11

Mtodo grfico de Bland y Altman

La diferencia entre
ambos mtodos es
LINEAL a lo largo del
rango de medicin

Error sistemtico
proporcional

Pgina 1122

C aptulo 11

Pgina 1123

Mtodo grfico de Bland y Altman: Interpretacin


- Existe un importante error sistemtico porque los puntos se distribuyen preferentemente
por encima de la recta correspondiente a la diferencia 0 entre medidas (lnea horizontal
naranja).
- El error sistemtico es proporcional porque la diferencia entre ambos mtodos es LINEAL
(lnea rosa) a lo largo del rango de medicin.
- La lnea azul representa la media de las diferencias, que en nuestro ejemplo corresponde
a 3,2 (error sistemtico del segundo mtodo digital- respecto al primero analgico-).
- Las lneas marrones representan los lmites de confianza definidos mediante 2 DE de
la media de la diferencia (de -3,8 a +10,2 ), y se denominan lmites de concordancia.

C aptulo 11

Pregunta de investigacin
El objetivo de este estudio ha sido analizar la concordancia entre dos mtodos enzimticos de determinacin de la
AMILASA srica perteneciente a una misma casa comercial
y basados en el mismo principio fsico-qumico.
Amilasa antigua

Cul es el test estadstico ms acertado?

Amilasa nueva

Pgina 1124

C aptulo 11

Mtodo grfico de Bland y Altman


La diferencia entre ambos
mtodos es LINEAL a lo
largo del rango de medicin

Error sistemtico
proporcional

Pgina 1125

C aptulo 11

Pgina 1126

Mtodo grfico de Bland y Altman: Interpretacin


- Existe un error sistemtico porque casi todos los puntos se distribuyen preferentemente
por encima de la recta correspondiente a la diferencia 0 entre medidas (lnea horizontal
naranja).
- El error sistemtico es proporcional porque la diferencia entre ambos mtodos es LINEAL
(lnea rosa) a lo largo del rango de medicin.
- La lnea azul representa la media de las diferencias, que en nuestro ejemplo corresponde
a 11,8 (y nos mide el error sistemtico del segundo mtodo amilasa nueva- respecto al
primero clsica-).
- Las lneas marrones representan los lmites de confianza definidos mediante 2 DE de
la media de la diferencia (de -21,2 a +44,8 ), y se denominan lmites de concordancia.

C aptulo 11

Evaluacin de mtodos diagnsticos cuantitativos


Recomendaciones de Zaydman

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.

Pgina 1127

C aptulo 11

Recomendaciones de Zaydman
Modelos de regresin de Passing-Bablock
No debe utilizarse porque NO cumple la condicin:
1. La razn de varianzas en Y y X iguale el cuadrado de la pendiente.

Sy 2
Sx 2

= [ 1 ]2

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.

Pgina 1128

C aptulo 11

Pgina 1129

Recomendaciones de Zaydman
Mtodo de mnimos cuadrados (mtodo regresin lineal simple)
No debe utilizarse porque NO cumple los siguientes requisitos:
1. Ausencia de error en la variable PREDICTORA (independiente) X.
2. Que el error en la variable RESULTADO Y debe ser homogneo en todo el intervalo
de concentraciones.

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.

C aptulo 11

Pgina 1130

Recomendaciones de Zaydman
Mtodo de mnimos cuadrados ponderado
Debe utilizarse cuando:
Los errores en la variable predictora (independiente) x son pequeos frente al intervalo
de concentraciones medido (glucemia).

Mtodo de regresin ortogonal de Deming


Debe utilizarse cuando:
Cuando los errores en la variable predictora x son significativos frente al intervalo
ensayado, cuando el intervalo de concentraciones es estrecho (kaliemia).

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.

C aptulo 11

Pgina 1131

C aptulo 11

Pgina 1132

Pregunta de investigacin
El objetivo de este estudio ha sido analizar la concordancia
entre dos dispositivos de medida del oxido ntrico (NO) exhalado, un Analizador de quimioluminiscencia estacionario
(NIOX Aerocrine) analizador ideal, y un analizador porttil
(NIOX-MINO), basado en anlisis electroqumico.
Equipo estacionario
N-6008 SIR

Equipo porttil
NIOX-MINO

Cul es el test estadstico ms acertado?

Fortuna AM, Feixas T, Casan P. Determinacin de xido ntrico en aire espirado (FENO) mediante un equipo
porttil (NIOX-MINO Aerocrine) en poblacin sana. Arch Bronconeumol. 2007;43:176-9.

C aptulo 11

Pgina 1133

Anlisis estadstico
Para la descripcin de los valores de FENO se facilitan valores medios desviacin
estndar. La comparacin entre valores medios se llev a cabo mediante un test de MannWhitney. La comparacin de los resultados individuales se analiz mediante la correlacin
de Pearson. En todos los casos la aproximacin ha sido bilateral y el nivel de significacin
el habitual del 5% ( = 0,05). El programa informtico empleado en el anlisis fue el
paquete estadstico SPSS versin 11.

Fortuna AM, Feixas T, Casan P. Determinacin de xido ntrico en aire espirado (FENO) mediante un equipo
porttil (NIOX-MINO Aerocrine) en poblacin sana. Arch Bronconeumol. 2007;43:176-9.

C aptulo 11

Pgina 1134

50

FENO (ppb) con el equipo NIOX-MINO

[NIOX-MINO] = 10 + 1,5 [N-6000 SIR]


40

30

20
10

r = 0,855; p =0,001

0
0

10

20

FENO (ppb) con el equipo N-6000 SIR

Fig. 3. Correlacin de xido ntrico en aire espirado (FENO) entre la determinacin con los equipos
N-6008 SIR (sensor de quimioluminiscencia) y NIOX-MINO (mtodo de electroqumica) en voluntarios
sanos. La correlacin de Pearson muestra la curva de regresin lineal entre ambos equipos (y = FENO
[ppb] con equipo NIOX-MINO; x = FENO [ppb] con el equipo N-6008 SIR).

C aptulo 11

Pgina 1135

Resultados
El valor medio ( desviacin estndar) de FENO con el equipo NIOX-MINO fue de 20 7
ppb (rango: 8-41ppb), y con el sensor N-6008, de 7 5 ppb (rango: 1-19 ppb).
Se observ una correlacin directa y estadsticamente significativa de la determinacin
de FENO entre ambos equipos (r = 0,92; p = 0,001). Los valores de FENO con el equipo
NIOX-MINO siempre fueron superiores a los obtenidos con el equipo N-6008. Adems,
la curva de regresin lineal demostr un factor de correccin de: FENO (NIOX-MINO) =
10 + 1,5 FENO (N-6008) (fig. 3).

Fortuna AM, Feixas T, Casan P. Determinacin de xido ntrico en aire espirado (FENO) mediante un equipo
porttil (NIOX-MINO Aerocrine) en poblacin sana. Arch Bronconeumol. 2007;43:176-9.

C aptulo 11

Pgina 1136

Discusin
Al comparar los 2 equipos y mtodos se constata que existe una muy buena correlacin
de cada determinacin de FENO para ambos equipos, con un factor de correccin entre
los valores de los 2 equipos de 1,5 + 10 para cada valor de FENO obtenido con el equipo
N-6008 (figs. 2 y 3), lo que coincide con los valores obtenidos por otros autores.

Fortuna AM, Feixas T, Casan P. Determinacin de xido ntrico en aire espirado (FENO) mediante un equipo
porttil (NIOX-MINO Aerocrine) en poblacin sana. Arch Bronconeumol. 2007;43:176-9.

C aptulo 11

Pgina 1137

C aptulo 11

Pgina 1138

Mito 1: La sonrisa de la esfinge

Por qu das un valor de corte, como valor de referencia, a partir de la media ms 2


desviaciones estndar?
El clculo de valores de referencia basado en la media 2 desviaciones estndar slo
puede aplicarse si las variables siguen distribuciones normales.
Se cumplen la normalidad de la variable cuantitativa (medida del NO en el aire exhalado)
en los dos instrumentos comparados?
No aportas ningn test estadstico (analtico o grfico) que demuestre que dicha variable
sigue la distribucin normal. En la tabla I aparecen otros trabajos (5 y 10) se han tenido que
realizar transformaciones logartmicas para normalizar la variable.
Seguro que sigue una distribucin normal?

C aptulo 11

Pgina 1139

Mito 1: La sonrisa de la esfinge

Por qu has elegido el coeficiente de correlacin de Pearson? Se cumplen todos


los requisitos para poder utilizarlo?Te permite ese test decir que los resultados son
intercambiables entre ambos instrumentos de medida?
El coeficiente de correlacin de lineal (r) de Pearson NO resulta una medida adecuada
del grado de acuerdo o concordancia entre dos mediciones de un mismo parmetro (NO),
ya que si dos instrumentos miden sistemticamente cantidades diferentes uno del otro, la
correlacin puede ser perfecta (r 1), a pesar de que la concordancia sea nula.
El coeficiente de correlacin r de Pearson deca que la magnitud de la asociacin de la
medida del NO entre el equipo NIOX-MINO y el equipo N-6008 es del 92% (r=0,92) de
la mxima posible.

C aptulo 11

Mito 1: La sonrisa de la esfinge

Por qu has elegido el coeficiente de correlacin de Pearson? Se cumplen todos


los requisitos para poder utilizarlo?Te permite ese test decir que los resultados son
intercambiables entre ambos instrumentos de medida?
Se ha demostrado que el coeficiente de correlacin de Pearson para evaluar la
concordancia entre medidas cuantitativas es insuficiente-inadecuado y que la
interpretacin de dicho coeficiente como una medida de concordancia es errnea. La
igualdad de medias tan slo garantiza que los 2 mtodos se centran en el mismo valor,
pero en ningn caso que todos sus valores sean iguales.

Pgina 1140

C aptulo 11

Pgina 1141

Mito 1: La sonrisa de la esfinge

Por qu utilizas el test de Mann-Whitney?


Los autores utilizan para la comparacin de medias el test de Mann-Whitney, que es
una prueba no paramtrica de comparacin de medias para grupos independientes; sin
embargo, al tratarse de medidas apareadas, deberan haber utilizado el test no paramtrico
para la comparacin de medias de medidas apareadas, que es la prueba de Wilcoxon.

C aptulo 11

Pgina 1142

Mito 1: La sonrisa de la esfinge

Afortunadamente, un buen estudio con un anlisis deficiente siempre se puede volver


a analizar. Hay paquetes estadsticos (MedCalc) que incorporan directamente un
procedimiento de comparacin de mtodos que incluyen el clculo de test que determinan
la concordancia entre medidas cuantitativas:
a) mtodos analticos, a travs del clculo de diferentes coeficientes que evalan
la concordancia, como el coeficiente de correlacin intraclase o el coeficiente de
correlacin-concordancia de Lin, modelos de regresin (modelos de regresin de
Deming y de Passing-Bablock), ANOVA de medidas repetidas y modelos de ecuaciones
estructurales, y
b) mtodos grficos como el mtodo de Bland y Altman (que calcula un intervalo de
concordancia), el grfico de distribucin acumulativa emprica grfico montaa
(mountain plot) o el grfico de la concordancia- supervivencia (survival-agreement plot).

C aptulo 11

Pgina 1143

Mito 1: La sonrisa de la esfinge

Como puedes observar en la tabla I he realizado una revisin bibliogrfica ms exhaustiva


que la tuya en la literatura mdica.
He encontrado en la pgina web http://www.nioxmino.com/references.html) muestra
diversos estudios que s utilizan algunos de estos mtodos (tabla I). Si hubieras usado los
grficos de Bland y Altman puede que hubieras encontrado (como los estudios 6 y 7 de
la tabla) una relacin entre los valores apareados de FENO con los 2 equipos de medida
de tipo heterocedstica, es decir, a mayores valores de FENO, mayores son las diferencias
entre las medidas.

C aptulo 11

Pgina 1144

C aptulo 11

Mito 1: La sonrisa de la esfinge

Por qu no indicas el intervalo de confianza del coeficiente de correlacin de Pearson?


Los autores no aportan un intervalo de confianza para dicho coeficiente. Calculado
por m, dicho intervalo del 95% es de 0,83 a 0,96, lo que implica que valores posibles
de dicho coeficiente podran ser inferiores a 0,90, los cuales empricamente se han
clasificado como correlacin slo buena.

Pgina 1145

C aptulo 11

Mito 1: La sonrisa de la esfinge

Eres el nico autor que ha investigado la correlacin entre dichos instrumentos?


Por qu no comparas tus resultados con los publicados en la bibliografa?
Otros trabajos, encontrados en mi revisin bibliogrfica, ninguno de los cuales han sido
mencionados por los autores, ofrecen coeficientes de correlacin de Pearson mejores
que el tuyo (0,92) y mucho ms cercanos a 1, como se indica en la tabla I.

Pgina 1146

C aptulo 11

Pgina 1147

C aptulo 11

Pgina 1148

Mito 1: La sonrisa de la esfinge

Como has podido ver en la tabla I, aunque otros autores tambin han utilizado slo el
coeficiente de correlacin de Pearson (trabajos 2, 8 y 11), este valor nicamente indica la
fuerza de asociacin entre 2 variables (la proximidad de los puntos de los 2 mtodos de
medida a la recta de regresin) y que dicha relacin es lineal, pero no necesariamente
que dicha recta sea la bisectriz; ni siquiera una correlacin perfecta es sinnimo de
concordancia perfecta.

C aptulo 11

Pgina 1149

Mito 1: La sonrisa de la esfinge

Aunque te puedo creer cuando describes las bondades de la medida de FENO con el
nuevo equipo porttil (sencillez, rapidez, manejabilidad, coste, etc.) y su utilidad en el
diagnstico y seguimiento del paciente asmtico, lo que en ningn caso, te puedo admitir
del anlisis estadsticos de tus datos es que dicho equipo sea concordante (fiable) con
el usado como referencia, ni que los valores de referencia propuestos sean vlidos sin
aportar informacin acerca de la forma de la distribucin de la variable.

C aptulo 11

2007; 67(6): 572-7

Pgina 1150

C aptulo 11

Pgina 1151

Anlisis estadstico
En el anlisis estadstico se ha estudiado la regresin de las medias de FENO obtenidas
con ambos dispositivos de medida respecto a la diferencia de las mismas, mediante
el mtodo Bland-Altman, tanto en valores absolutos como relativos. Asimismo, se ha
analizado el grado de acuerdo entre los dos dispositivos de medida, en relacin con los
valores de normalidad para ambos, mediante el estadstico kappa de Cohen.

C aptulo 11

40

30

DIFERENCIA

+ 2 DE
20
Media

10

-10

- 2 DE

50

100

150

200

Media FENO
Figura 2: Anlisis estadstico (Bland-Altman). Media FENO: media de la fraccin exhalada de xido ntrico;
DIF: diferencia de las medias de FENO obtenidas con NIOX y con NIOX-MINO, en valores absolutos.

Pgina 1152

C aptulo 11

Pgina 1153

Mito 1: La sonrisa de la esfinge

- Existe un error sistemtico porque casi todos los puntos se distribuyen preferentemente
por encima de la recta correspondiente a la diferencia 0 entre medidas (lnea horizontal
naranja).
- El error sistemtico es PROPORCIONAL porque la diferencia entre ambos mtodos es
LINEAL (lnea rosa) a lo largo del rango de medicin.
- La lnea azul representa la media de las diferencias, que en nuestro ejemplo
corresponde a 11 (y nos mide el error sistemtico del segundo mtodo porttil-respecto
al primero).
- Las lneas marrones representan los lmites de confianza definidos mediante 2 DE de
la media de la diferencia (de -3 a +25), y se denominan lmites de concordancia.

C aptulo 11

Anlisis estadstico mediante el ndice kappa de Cohen


NIOX-MINO

NIOX

TOTAL

Anormal (+)

Normal (-)

Anormal (+)

10

Normal (-)

18

20

Total

11

19

30

Punto de corte de FENO: media de la fraccin exhalada de xido ntrico.

Medida de acuerdo

Valor de Kappa

EEk

Significacin

Kappa de Cohen

+ 0,780

0,120

4,286

0,000

N de casos vlidos

20

Pgina 1154

C aptulo 11

Resultados (fragmento del texto)


La regresin de las medias obtenidas por ambos dispositivos de medida de FENO
respecto a la diferencia de las mismas fue significativa, tanto en valores absolutos como
relativos (p < 0,005) (fig. 2). Asimismo, hubo acuerdo entre los valores obtenidos con
ambos dispositivos de medida, kappa de Cohen 0,78 (fig. 3).

Pgina 1155

C aptulo 11

Pgina 1156

Discusin (fragmento del texto)


El objetivo de nuestro estudio ha sido analizar la concordancia entre dos dispositivos de
medida para NO exhalado, sistema NIOX y sistema porttil NIOX-MINO. Segn los datos
obtenidos en nuestra muestra, observamos que existen diferencias significativas (p <
0,005) en la regresin de las medias obtenidas por ambos dispositivos de medida respecto
a la diferencia de las mismas. Por tanto, los dos sistemas estudiados no son equivalentes,
por lo que no son sustituibles. De acuerdo con otros investigadores, los valores obtenidos
con el sistema NIOX-MINO han sido significativamente superiores a los obtenidos con el
sistema NIOX, tanto ms cuanto mayor ha sido el valor de FENO obtenido (fig. 2).

C aptulo 11

Pgina 1157

Discusin (conclusiones)
En conclusin, la FENO, determinada mediante tcnica electroqumica con sistemas
porttiles, es vlida en nios mayores de 5 aos y ofrece la posibilidad de cuantificar de
forma simple y no invasiva la inflamacin eosinoflica de la va area, que resulta de gran
utilidad como complemento a la funcin pulmonar en el diagnstico de asma y en el control
del tratamiento en nios.

Introduccin (fragmento del texto: objetivos)


El objetivo de este estudio ha sido analizar la concordancia entre dos dispositivos de
medida de NO exhalado, un analizador de quimioluminiscencia estacionario (NIOX,
Aerocrine, Suecia), considerado como analizador.

C aptulo 12

Captulo 12
Publicacin Bioestadstica: Anlisis multivariante.

Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Pgina 1158

C aptulo 12

Fases del anlisis estadstico


1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE

Pgina 1159

C aptulo 12

Anova de 2 factores
Variable
Predictora 1
Causa o Factor 1: Cualitativa

Variable RESULTADO
Interaccin
Variable
Predictora 2
Causa o Factor 2: Cualitativa

Desenlace o efecto:
Cuantitativa

Pgina 1160

C aptulo 12

Anova de 2 factores
Factor 1:
Variable predictora 1

F= 7,49 p<0,01

Grupo cultural

F= 1,09 p<0,01

Interaccin
Factor 2:
Variable predictora 2
Tabaquismo materno

F= 0,59 N.S

Variable RESULTADO
Cuantitativa
Desenlace o efecto:
Peso del RN

Pgina 1161

C aptulo 12

Pgina 1162

Anlisis de la varianza (ANOVA) de dos factores


Variable dependiente cuantitativa: Peso del RN
Factor 1 cualitativa: Grupo cultural
Factor 2 cualitativa: Tabaquismo materno
Estudio de la variable resultado peso del RN. Efecto de las variables predictoras grupo cultural y hbito de
tabaquismo en las madres.
Factor

Varianza

Significacin

Grupo cultural

3,2631

7,49

p < 0,01

Tabaquismo

2,5776

0,59

N.S

Interaccin (*)

4,7592

1,09

p < 0,01

(*) Test ANOVA de dos factores

Las diferencias en el peso de los RN se mantuvieron slo dependientes del grupo cultural
o de la interaccin de ambos factores, pero no del hbito de fumar. A ello pudo contribuir
el bajo nmero de madres musulmanas fumadoras.

C aptulo 12

Anova de 2 factores
Factor 1:
Variable predictora 1

F= 3,67 p<0,01

Grupo cultural

F= 0,34 N.S

Variable RESULTADO
Cuantitativa
Desenlace o efecto:
VCM

Factor 2:
Variable predictora 2
Tipo de lactancia

F= 1,03

p<0,01

Pgina 1163

C aptulo 12

Pgina 1164

Anlisis de la varianza (ANOVA) de dos factores


Variable dependiente o resultado cuantitativa: VCM
Factor 1 cualitativa (variable predictora principal): Grupo cultural
Factor 2 cualitativa (variable predictora secundaria): Tipo de lactancia
Estudio de la variable resultado VCM en lactantes. Efecto de las variables predictoras grupo cultural y tipo
de lactancia.
Factor

Varianza

Significacin

Grupo cultural

6,0017

3,673

p < 0,01

Lactancia

1,6904

1,034

p < 0,01

Interaccin (*)

0,5579

0,341

N.S

(*) Test ANOVA de dos factores

Las diferencias en el VCM (microcitosis) se mantuvieron dependientes tanto del grupo


cultural como del tipo de lactancia, pero no de la interaccin de ambas variables.

Daz Portillo J. Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta. Tesis doctoral . Facultad de Medicina. Universidad de Cdiz . Noviembre 1997.

C aptulo 12

Pgina 1165

Anlisis multivariante
Anlisis multivariante para la deteccin de potenciales factores de
confusin
Variable Predictora 1
Variable Predictora 2
Variable Predictora 3
Variable Predictora 4
Variable Predictora 5
Variable Predictora n

Variable Resultado

C aptulo 12

Pgina 1166

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable
Independiente o
PREDICTORA

Variable
Dependiente o
RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de Fisher
Test de McNemar
Q de Cochran
REGRESIN LOGSTICA

Si el tamao muestral es grande


Si el tamao muestral es pequeo
Dos grupos de muestras repetidas o apareadas
Ms de dos grupos de muestras repetidas o apareadas
Varias variables predictoras cualitativas

Cualitativa

Cuantitativa

t de Student
Anlisis de la Varianza
Test de Mann-Whitney
Test de Wilcoxon
Test de Kruskall-Wallis
Test de Friedman

Compara medias entre dos grupos independientes


Compara medias entre ms de dos grupos independientes
Dos grupos independientes No paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, medidas repetidas
Ms de dos grupos No paramtrico medidas repetidas

Cuantitativa

Cualitativa

Regresin logstica simple


Regresin logstica multivariante

Una sola variable predictora cuantitativa


Varias variable predictoras cuantitativa o cualitativas

Cuantitativa

Cuantitativa

Regresin lineal simple


Correlacin de Pearson
Correlacin de Sperman
REGRESIN MLTIPLE

Paramtrico
Paramtrico
No paramtrico
Varias variables predictoras cuantitativas

Cualitativa

Superviviencia

Kaplan-Meier
Long-Rank
Regresin de COX

Curvas de superviviencia
Compara curvas de superviviencia
Anlisis Multivariante

C aptulo 12

REGRESIN LINEAL
MLTIPLE

REGRESIN LOGSTICA
MULTIVARIANTE

Variable
RESULTADO

Cuantitativa

Cualitativa
(dicotmica)

Variables
PREDICTORAS

Cualitativa
Cuantitativa

Cualitativa
Cuantitativa

ECUACIN

Pgina 1167

C aptulo 12

Regresin logstica multivariante

Es un modelo de regresin que permite estudiar si una variable resultado


de tipo cualitativa nominal depende, o no, de otras variables predictoras. La
naturaleza de las variable predictoras puede ser:
- Categrica DICOTMICA, es decir, slo puede admitir dos posibles
resultados.
- CUANTITATIVA (discreta o continua).

Pgina 1168

C aptulo 12

Regresin logstica multivariante

Variable Predictora 1
Variable Predictora 2
Variable Predictora 3
Variable Predictora 4
Variable Predictora 5
Variable Predictora n

Variable Resultado

Cualitativa dicotmica

Pgina 1169

C aptulo 12

Ejemplos de posibles modelos de regresin logstica


Variable RESULTADO

Variables PREDICTORAS

Curacin (si/no)

tratamiento aplicado
grado de cumplimiento
gnero
comorbilidad

HTA (si/no)

ingesta de sal
antecedentes familiares
edad

Morir por cncer de mama

grado del tumor


edad
tipo histolgico
receptores hormonales

RN de bajo peso

HTA, edad, tabaquismo, peso materno,


raza, complicaciones obsttricas

Pgina 1170

C aptulo 12

Pgina 1171

Aplicacin de los modelos de regresin logstica

- En ENSAYOS CLNICOS en los que se evala un evento o resultado en


relacin a uno o ms factores etiolgicos, predictores o asociados (RR).
- En estudios de COHORTES en los que se evala un evento o resultado en
relacin a uno o ms factores de riesgo (etiolgicos, predictores o asociados)
(RR).
- En estudios de CASOS Y CONTROLES en los que se evalan diferentes
factores en cada grupo, para encontrar asociaciones entre ellos y la
enfermedad o caso (OR).
- En estudios TRANSVERSALES en los que se evalan diferentes variables
predictoras (factores de riesgo), para encontrar asociaciones entre ellas y la
enfermedad en estudio (variable resultado).

C aptulo 12

Pgina 1172

Objetivos de los modelos de regresin logstica

1. ESTIMAR la relacin entre una o ms variables predictoras con la variable


resultado.
- Estudios etiolgicos.
- Confusin e interaccin.
2. PREDECIR lo mejor posible la variable RESULTADO o respuesta, usando
la combinacin ms eficiente de las variables PREDICTORAS incluidas en el
estudio.

C aptulo 12

Caractersticas de los modelos de regresin logstica


multivariante
- La variable RESULTADO es siempre cualitativa discreta

Si = 1

No = 0
- Las variables PREDICTORAS del modelo puede ser

Continuas

Discretas
- La ecuacin inicial del modelo NO es una funcin lineal, sino
EXPONENCIAL, si bien una sencilla transformacin logartmica (LOGIT) la
convierte finalmente en una funcin lineal, que sigue la ecuacin de la recta
cuyas pendientes son los distintos coeficientes de regresin i.

Pgina 1173

C aptulo 12

Anlisis de regresin logstica mltiple

Pgina 1174

C aptulo 12

Pgina 1175

Ventajas de los modelos de regresin logstica multivariante


(1)
1. Es un modelo til en muchas circunstancias de investigacin en medicina...
- En las que se quiere analizar o predecir una respuesta dicotmica de la
variable resultado
Enfermo / sano
Vive / muere
Presente / ausente
Positivo / negativo
- En funcin de su perfil de variables predictoras o factores de riesgo, que
pueden ser
cualitativas: gnero, sexo, grupo cultural, estado civil, nivel de estudios,
nivel socioeconmico,...
cuantitativas: edad, n de cigarrillos, IMC, colesterol, TAS,...

C aptulo 12

Pgina 1176

Ventajas de los modelos de regresin logstica multivariante


(2)
2. Es la mejor aproximacin a la realidad biolgica, ya que la influencia
de una variable predictora o factor de riesgo sobre la probabilidad de
que aparezca una enfermedad (variable resultado) suele asemejarse
ms a una curva sigmoidea (funcin exponencial) que a una recta.
La curva sigmoidal es la representacin habitual de una respuesta a
diferentes dosis de un estmulo.
Probabilidad de
enfermedad
coronaria

X1

Factor de riesgo: cLDL

C aptulo 12

Pgina 1177

Ventajas de los modelos de regresin logstica multivariante


(3)
3. El modelo matemtico del modelo permite obtener directamente la ODDS
RATIO (OR) o el RIESGO RELATIVO (RR) para cada factor de riesgo o
variable PREDICTORA incluida en el modelo. El coeficiente i de cada
variable predictora obtenido por regresin logstica es el logaritmo neperiano
de la OR o del RR del factor de riesgo.

OR

OR1 = e 1

RR

RR1 = e 1

C aptulo 12

Pgina 1178

Funciones de los modelos de regresin logstica


multivariante
1. CUANTIFICAR la relacin existente entre las distintas variables predictoras incluidas en
el modelo y la variable resultado (respuesta).
2. CONTROLAR Y AJUSTAR aquellas variables predictoras que actan como potenciales
FACTORES MODIFICADORES de EFECTO, especialmente los FACTORES de
CONFUSIN.
3. PREDECIR LA RESPUESTA de la variable resultado en funcin de las variables
predictoras o factores de riesgo, clasificando a los individuos en una de las dos posibles
respuestas en funcin de la probabilidad que arroje su perfil de variables predictoras
incluidas en el modelo de regresin logstica multivariante.

C aptulo 12

Variables explicativas o predictoras en el modelo de


regresin logstica
Variables CUALITATIVAS

Variables CUANTITATIVAS

El modelo asume estimaciones basadas en variables continuas

La OR y el RR son medidas que cuantifican el cambio en el riesgo cuando se


pasa de un valor del factor a otro

Las variables cualitativas deben ser


modeladas en 2 categoras (0,1) o
transformadas en tantas variables
dicotmicas como categoras (variables DUMMY)

Este aumento o disminucin del riesgo es


lineal y proporcional al cambio

Pgina 1179

C aptulo 12

Pgina 1180

Regresin logstica:
Estimacin de coeficientes i
0, 1, 2,.., n son los coeficientes de regresin logstica del modelo
- 0 es el trmino independiente (o constant en SPSS)
- El resto de las i son los coeficientes de regresin logstica para las
diferentes variables predictoras incluidas en le modelo
- La evidencia de relacin entre una variable predictora y la variable
resultado es la existencia de un coeficiente de regresin logstica
significativamente diferente a cero i 0
- El signo de i tiene un significado importante porque
- Si es positivo (i > 0) significa que esa variable predictora AUMENTA la
PROBABILIDAD del suceso (variable resultado o respuesta) que estamos
analizando.
- Si es negativo (i < 0) su clculo se lleva a cabo mediante la FUNCIN
DE MXIMA VEROSIMILITUD.

C aptulo 12

Pgina 1181

Regresin logstica:
Definicin de las hiptesis nula Ho y alternativa Ha
- La hiptesis conceptual es que una o varias variables predictoras influyen
significativamente en la probabilidad del suceso en estudio (que la variable
predictora tome un valor u otro)
- Las hiptesis operativas se reducen al contraste de los diferentes
coeficientes i obtenidos en el anlisis de los datos como estimadores de las
variables predictoras de inters
As, cuando slo hay una variable predictora X1
H0
1 = 0
Ha

1 0
- Hay varios procedimientos para llevar a cabo este contraste.

C aptulo 12

Pgina 1182

Regresin logstica:
Procedimientos para evaluar el contraste de hiptesis
1. Evaluacin estadstica del coeficiente i
2. Evaluacin estadstica de WALD
- El estadstico de WALD es el resultado de dividir el cuadrado del coeficiente
de regresin logstica i por el cuadrado de su error estndar EEi
3. Evaluacin estadstica de la razn de verosimilitud (L0)
4. Evaluacin estadstica del cambio del estadstico -2LL0
- Este estadstico resulta ser menor de dos veces el logaritmo neperiano de la
razn de verosimilitud (L0)
5. Evaluacin del estadstico Z2, (Goodness of Fit)

C aptulo 12

Pgina 1183

1. Evaluacin estadstica del coeficiente i


- El coeficiente de regresin logstica i de la variable predictora i debe
ser estadsticamente distinto de cero i 0 para que esta tenga influencia
significativa sobre la variable resultado.
- La hiptesis H0 ser que... i = 0
- La hiptesis Ha ser que... i 0
- Para tener en cuenta el error aleatorio (EEi) con que el coeficiente
i (obtenido en la regresin logstica) estima al coeficiente de regresin
poblacional n se lleva a cabo un contraste a travs del estadstico t
de Student con un nmero de grados de libertad igual al nmero de
individuos de la muestra (N) menos el nmero de variables predictoras (n)
introducidas en el modelo.

C aptulo 12

Pgina 1184

Interpretacin del coeficiente de regresin logstica i


- Si su signo es positivo (i > 0), la probabilidad de que se d o aparezca la
caracterstica de la variable predictora aumentar segn aumente el valor de
xn (la variable resultado a quien afecta).
- Si i 0 es significativamente distinta de cero (test de contraste de hiptesis
p < 0,05), la variable predictora i influye significativamente en la probabilidad
de que se d o aparezca la caracterstica de la variable resultado, y el modelo
logstico tiene sentido.

C aptulo 12

Pgina 1185

2. Evaluacin estadstica de Wald

El estadstico de Wald (W) es tambin muy utilizado para evaluar la


significacin estadstica del modelo de regresin logstica multivariante.
El estadstico W se obtiene dividiendo el cuadrado de i por el cuadrado del
error estndar de i

El estadstico de Wald se distribuye segn una CHI CUADRADO.


La hiptesis a contrastar son las mismas que en el caso anterior
La hiptesis H0 ser que... W = 0
La hiptesis Ha ser que... W 0

C aptulo 12

Pgina 1186

Evaluacin del modelo de Regresin logstica multivariante mediante el programa estadstico SPSS
ESTADSTICO

HIPTESIS NULA

CONTRASTE

SIGNIFICACIN

i = 0

t de Student

p < 0,05

i = 0

CHI CUADRADO

p < 0,05

- 2 Log Likelihood
(-2LL)

L=1

CHI CUADRADO
con n-k-1 grados de
libertad

Si rechaza la hiptesis
nula
(p < 0,05) significa que el
modelo de regresin no
es significativo

Improvement
o cambio en la razn
de verosimilitud en
cada paso

(-2LLK-1) - (-2LLK )

CHI CUADRADO
con k grados de
libertad

p < 0,05

Z2
(Goodness of Fit)

Z2 0

CHI CUADRADO

Si se rechaza la
hiptesis nula
(p < 0,05) significa que el
modelo de regresin no
es significativo

Model Chi- Square

(-2LL0) - (-2LLK )

CHI CUADRADO
con k grados de
libertad

p < 0,05

Wald
(i)2 / (EEi)2

(-2LL) = 0
ajuste perfecto

C aptulo 12

Pgina 1187

Evaluacin del modelo de Regresin logstica multivariante


mediante el programa estadstico SPSS
ESTADSTICO

HIPTESIS NULA

CONSTANTE

SIGNIFICACIN

i = 0

t de Student

p < 0,05

W=0

CHI CUADRADO

p < 0,05

Wald
[i]2
[EEi]2

Si se rechaza la hiptesis nula (Ho) (p< 0,05) significa que el modelo de regresin es
significativo.

C aptulo 12

Es posible predecir el estado de los depsitos medulares


de hierro conociendo los niveles sricos de ferritina y el
VCM del hemograma?
Variable predictora 1
VCM

Variable resultado cualitativa


Depsitos de hierro en
Mdula sea

Variable predictora 2
FERRITINA
(srica)

1 = Depsitos de hierro normales


0 = Dficit de hierro medular

Pgina 1188

C aptulo 12

Anlisis de regresin lineal mltiple


Posible variables predictoras asociadas a los depsitos de hierro en mdula sea
Variables predictoras

Estimacin

Error estndar EE

Constante

- 0,6799

VCM

- 0,02223

0,03835

FERRITINA srica

0,1919

0,05525

Para que una variables PREDICTORAS est relacionada estadsticamente con la


variable resultado (depsitos de hierro en mdula sea) debe cumplirse siempre la
condicin de que

Ferritina

0,1919

=
= 3,47 > Z95% (1,96)
0,05525
Ferritina

EE
VCM

EE VCM

-0,02223
0,03835

= 0,06 << Z95% (1,96)

p < 0,05

p > 0,05

Pgina 1189

C aptulo 12

Mtodo de introduccin de las


variables

REGRESIN LINEAL
MLTIPLE

REGRESIN LOGSTICA
MULTIVARIANTE

Forward (hacia adelante)

Introducir progresivamente en el modelo las variables


predictoras estadsticamente significativas, comenzando por
la que tenga mayor significacin

Backward (hacia atrs)

Comienza por estimar un modelo que contiene todas las


variables predictoras para ir eliminando posteriormente
una a una, de forma sucesiva, aquellas que no sean
significativas

Stepwise

Es una combinacin de los anteriores

Pgina 1190

C aptulo 12

Anlisis de Regresin Logstica mltiple


Qu relacin existe entre las variables predictoras VCM
y Ferritina srica y los depsitos de hierro medular?
Variables PREDICTORAS
VCM y Ferritina srica

log

log

P
1-P
P
1-P

Variable RESULTADO
Depsitos de Fe medular

= 0 + X1 + 2X2

= -2,1290 + 0,1713 FERRITINA

P = probabilidad de que existan depsitos de hierro medular

Pgina 1191

C aptulo 12

Anlisis de Regresin Logstica mltiple


Qu relacin existe entre las variables predictoras VCM
y Ferritina srica y los depsitos de hierro medular?
Variables PREDICTORAS
VCM y Ferritina srica

OR =

e (X)

OR = e

0,1713 (Xa Xb)

Xa = Niveles de ferritina srica del paciente A


Xb = Niveles de ferritina srica del paciente B

Variable RESULTADO
Depsitos de Fe medular

Pgina 1192

C aptulo 12

Pgina 1193

Qu diferencia promedio de probabilidades de tener depsitos


medulares normales existe entre un paciente A con 24 ng/ml de
ferritina y otro B con 3 ng/ml?
Variables predictoras

Paciente A

Paciente B

Ferrritina srica (ng/ml)

0,1713

24 ng/ml

3 ng/ml

OR =

OR =

i (X a X b)

0,1713 (24 - 3)

= 36,6

El paciente A tiene una probabilidad de 37 veces de tener depsitos medulares de


hierro normal frente al paciente B.

C aptulo 12

Pgina 1194

Pregunta de investigacin
- Qu relacin existe entre diversas posibles variables predictoras y la probabilidad de
muerte del recin nacido de bajo peso?
- Estudio de COHORTES realizado por Horbar et al (1993) con 3603 RN de peso entre
501-1500 g (2 aos de seguimiento).
Variable Predictora 1

Anlisis Multivariante

Variable Predictora 2
Variable Predictora 3
Variable Predictora 4
Variable Predictora 5

Variable Resultado
Probabilidad de morir

Variable Predictora n
Horbar JD, Onstad L, Wright E. Predicting mortality risk for infants weighing 501 to 1500 grams at birth: The
National Institutes of Health Neonatal Research Network report. Crit Care Med 1993; 21:1218.

C aptulo 12

Pgina 1195

Estudio de cohortes prospectivo de Recin Nacidos


Factores de Riesgo
Variables predictoras
Muertos por otras
causas

3603 RN de peso
comprendido
entre 501 y 1500 g

Variable RESULTADORESPUESTA-posible EFECTO


Variable dependiente
Variable cualitativa dicotmica

Fallecimientos

Sobrevivientes
Prdidas de
seguimiento
Seguimiento mediana 2 aos

Horbar JD, Onstad L, Wright E. Predicting mortality risk for infants weighing 501 to 1500 grams at birth: The
National Institutes of Health Neonatal Research Network report. Crit Care Med 1993; 21:1218.

C aptulo 12

Estudio de cohortes prospectivo de Recin Nacidos


Objetivo: Evaluar el riesgo de muerte en RN de bajo peso (entre 501 1500 g)
Variable resultado: Fallecimiento del RN (dicotmica)
Variable predictora [1]: peso en gramos del RN
Variable predictora [2]: Tamao segn edad gestacional
Variable predictora [3]: Raza
Variable predictora [4]: Sexo
Variable predictora [5]: tipo de parto (vaginal/cesrea)
Variable predictora [6]: presentacin del parto
Variable predictora [7]: ndice del Apgar al minuto
Variable predictora [8]: Presencia o no de complicaciones maternas (diabetes melitus,
eclampsia, hipertensin o hemorragia) antes del parto

Pgina 1196

C aptulo 12

1. Peso del RN
2. Tamao segn edad gestacional (BPSEG)
3. Raza
4. Sexo
5. APGAR al 1 minuto
6. Presentacin del parto
7. Tipo de parto
8. Complicaciones maternas de parto

Riesgo de muerte

Pgina 1197

C aptulo 12

Pgina 1198

Variables predictoras significativas en la regresin logstica


multivariante

1. Peso del RN
2. Tamao segn edad gestacional (BPSEG)
3. Raza
4. Sexo
5. APGAR al 1 minuto

Riesgo de muerte

C aptulo 12

Anlisis de regresin logstica mltiple


Estimacin del modelo para predecir la mortalidad en recin nacidos con
pesos entre 501 y 1500 gramos

Variables predictoras

2,606

Constante

t de Student

0,029

Peso (en gr/100)

- 0,422

0,157

BPSEG

- 0,491

0,145

Raza

- 0,450

p < 0,05

Sexo

0,656

0,131

Apgar

0,971

0,131

Pgina 1199

C aptulo 12

Pgina 1200

Tipos de variables del estudio Horbar et al.


Variable resultado (cualitativa dicotmica):

- Muerte = 1

- Sobrevivi = 0
1. Variable predictora 1: Peso del RN (gramos/100)
2. Variable predictora 2: Bajo peso segn la edad gestacional (BPSEG).

- Peso inferior al P10 para su edad gestacional = 1

- Peso igual o superior al P10 para su edad gestacional = 0
3. Variable predictora 3: RAZA

- Raza negra = 1

- Raza blanca = 0
4. Variable predictora 4: SEXO

- Hombre = 1

- Mujer = 0
5. Variable predictora 5: Indice de APGAR

- Apgar =< 3 = 1

- Apgar > 3 = 0
Horbar JD, Onstad L, Wright E. Predicting mortality risk for infants weighing 501 to 1500 grams at birth: The
National Institutes of Health Neonatal Research Network report. Crit Care Med 1993; 21:1218.

C aptulo 12

Pgina 1201

Qu diferencia promedio de riesgo de morir existe entre


un RN A con 850 gramos y otro B con 1250 gramos
iguales para el resto de las variables predictoras ensayadas?
Variables
predictoras

RN A

RN B

Peso en
gramos/100

- 0,422

850 g [8,5]

1250 g [12,5]

RR
RR =

-0,422
RR = e

i (X a X b)
(850/100 1250/100)

= 5.4

Un RN A de 850 g de peso al nacer


presenta 5.4 veces ms riesgo de
morir que otro RN B de 1250 g a
igualdad del resto de las variables
predictoras (Xi) incluidas en el
modelo.

C aptulo 12

Pgina 1202

Qu diferencia promedio de riesgo de morir existe entre


un RN A con SFA (Apgar < 3) con respecto a otro RN B sin
SFA (Apgar > 3) con igualdad para el resto de las variables
predictoras?
Variables
predictoras

RN A SFA (+)

RN B SFA (-)

APGAR (>3/<=3)
[1/0]

0,971

APGAR < 3 [1]

APGAR > 3 [0]

RR
RR =

RR =

e
e

i (X a X b)
0,971 (1 0)

= 2,62

Los RN con SFA presenta 2,62


veces ms riesgo de morir que los
RN sin SFA a igualdad del resto
de las variables predictoras (Xi)
incluidas en el modelo.

C aptulo 12

Pgina 1203

Qu diferencia promedio de riesgo de morir existe entre


un RN A nio con respecto a otro RN B nia con igualdad
para el resto de las variables predictoras incluidas en el
modelo?
Variables
predictoras

RN A nio

RN B nia

SEXO (hombre/
mujer) [1/0]

0,656

hombre [1]

mujer [0]

RR

e (X X )
0,656 (1 0)
RR = e
= 1,93
RR =

Los RN varones presentan 1,93


veces ms riesgo de morir (un 93%)
que los RN mujeres a igualdad del
resto de las variables predictoras
(Xi) incluidas en el modelo.

C aptulo 12

Pgina 1204

Qu diferencia promedio de riesgo de morir existe entre


un RN N de raza negra con respecto a otro RN B de raza
blanca con igualdad para el resto de las variables predictoras?
Variables
predictoras

RN N

RN B

Raza (>1/<=1)
[1/0]

- 0,450

Negra [1]

Blanco [0]

RR
RR =

RR =

i (X n X b)

e -0,450

(1 0)

= 0.64

Los RN de raza blanca estn a


1/0.64 = 1.56 veces (un 56%) ms
riesgo de morir que los RN de raza
negra a igualdad del resto de las
variables predictoras.

Los RN de raza negra presenta 0.64


veces ms riesgo de morir que los
RN de raza blanca a igualdad del
resto de las variables predictoras
incluidas en el modelo.

C aptulo 12

Pgina 1205

Qu diferencia promedio de riesgo de morir existe entre


dos RN A y B con las siguientes caractersticas?
Variables predictoras

RN A

RN B

Peso en gramos/100

- 0,422

1150 g [11,5]

1400 g [14,0]

Bajo peso para su edad


gestacional BPSEG [1/ 0]

- 0,491

BPPSEG [1]

[0]

Raza (>1/<=1) [1/0]

- 0,450

Negra [1]

Blanco [0]

Sexo (mujer/hombre) [1/ 0]

0,650

Nia [0]

Nio [1]

Apgar (<=3/ >3) [1/ 0]

0,971

Apgar <=3 [1]

Apgar >3 [0]

RR

El RN A (nia negra) presenta un


54% de riesgo de morir que el RN B
(nio blanco) segn el valor de las
variables predictoras incluidas en el
modelo.

C aptulo 12

Clculo de la probabilidad (P) de muerte individual


Variables predictoras

RN A

RN C

Peso en gramos/100

1150 g [11,5]

750 g [7,5]

Bajo peso para su edad


gestacional BPSEG [1/ 0]

BPPSEG [1]

[0]

Raza (>1/<=1) [1/0]

Negra [1]

Blanco [0]

Sexo (mujer/hombre) [1/ 0]

Nia [0]

Nio [1]

Apgar (<=3/ >3) [1/ 0]

Apgar <=3 [1]

Apgar >4 [1]

RN A

RN C

Pgina 1206

C aptulo 12

Pgina 1207

Estudio de Marshall et al. (NEOCOSUR)


- Objetivo: Desarrollar una ecuacin que permita predecir el riesgo de
mortalidad neonatal en RN de muy bajo peso de nacimiento basado en
variables predictoras conocidas en el momento del nacimiento, antes del
ingreso a la unidad de cuidado intensivo neonatal.
- Mtodos: Fueron incluidos en este estudio 1801 RN con peso al
nacimiento de 500 a 1500 gramos.
- Variables Predictoras: edad materna, peso de nacimiento, edad
gestacional, Apgar al 1 minuto, malformaciones congnitas mayores, sexo,
gestacin mltiple, uso de esteroides prenatales y peso pequeo para su
edad gestacional (BPSEG) (definida como ms bajo que Percentil 10 de
peso para edad gestacional).
Marshall G, Tapia JL, DApremont I, Grandi C. Un nuevo score para predecir el riesgo de mortalidad
neonatal del muy bajo peso de nacimiento en la red sudamericana NEOCOSUR. Journal of Perinatology
2005; 25:577582.

C aptulo 12

Pgina 1208

Estudio de Marshall et al (NEOCOSUR)


Objetivo: Predecir el riesgo de mortalidad neonatal en RN de muy bajo peso de nacimiento
(entre 500 1500 g)
Variable resultado: Fallecimiento del RN (dicotmica)
Variable predictora [1]: Edad materna
Variable predictora [2]: Peso de nacimiento
Variable predictora [3]: Edad gestacional
Variable predictora [4]: ndice del Apgar al minuto
Variable predictora [5]: Malformaciones congnitas mayores
Variable predictora [6]: Sexo
Variable predictora [7]: Gestacin mltiple
Variable predictora [8]: Uso de esteroides prenatales
Variable predictora [9]: Peso pequeo para su edad gestacional (definida como ms bajo
que Percentil 10 de peso para edad gestacional) (BPSEG)

C aptulo 12

5. Malformaciones
congnitas

1. Edad de la madre

2. Peso

Riesgo de
muerte

6. Sexo
7. Gestacin

3. Edad gestacional

8. Uso de esteroides
prenatales

4. APGAR al 1 minuto
9. BPSEG

Pgina 1209

C aptulo 12

Pgina 1210

Variables predictoras significativas en la regresin logstica


multivariante
Malformaciones
congnitas
Peso del RN

Edad gestacional

APGAR al 1 minuto

Riesgo de
muerte

Sexo

Uso de esteroides
prenatales

C aptulo 12

Pgina 1211

Estudio de Marshalll et al (NEOCOSUR)


APGAR
al 1 minuto

Malformaciones
congnitas

Fallecimientos
1801 RN de peso
comprendido entre
500 y 1500 g

Variable RESULTADO
Variable cualitativa dicotmica

Sobrevivientes
Peso
del RN

Edad
gestacional

Sexo

Esteroides
prenatales

Marshall G, Tapia JL, DApremont I, Grandi C. Un nuevo score para predecir el riesgo de mortalidad
neonatal del muy bajo peso de nacimiento en la red sudamericana NEOCOSUR. Journal of Perinatology
2005; 25:577582.

C aptulo 12

Pgina 1212

Anlisis de Regresin Logstica Mltiple: Estimacin del modelo para predecir la mortalidad en recin
nacidos con pesos entre 500 y 1500 gramos
Variables predictoras

Estimacin
Coeficiente

Error estndar
EE

Cociente
/ EE

OR

IC95%

8,378

0,99

Peso del RN

- 0,331

0,04

8,27

0,72

0,64 0,79

Edad gestacional

- 0,132

0,04

3,3

0,88

0,80 0,95

Apgar al minuto

0,265

0,03

8,83

0,77

0,71 0,82

Malformaciones
congnitas
(Si =1; No = 0)

3,419

0,64

5,32

30,55

8,74 106,77

Uso de esteroides
prenatales
(Si =1; No = 0)

- 0,302

0,08

3,77

0,74

0,58 0,89

Sexo (mujer =1;


hombre = 0)

- 0,474

0,16

2,96

0,62

0,30 0,93

Constante

Se ha utilizado el modelo de regresin logstica mltiple con un procedimiento paso a paso,descartndose


3 variables e incluyendo 6 variables predictoras que fueron estadsticamente significativos.

C aptulo 12

Pgina 1213

Interpretacin del modelo del estudio NEOCOSUR


La Tabla muestra los coeficientes del modelo de regresin logstica mltiple ,el error
estndar EE y los odds ratios (OR) asociados. Estos coeficientes para las 6 variables
predictoras seleccionadas en el modelo logstico permite evaluar el score NEOCOSUR
y puede ser usado para calcular el riesgo de mortalidad del RN con muy bajo peso al
nacimiento.
- Un aumento de 100 g en el peso de nacimiento redujo el riesgo de mortalidad
intrahospitalaria en 28% (OR = 0,72).
- La adicin de 1 punto en el score de Apgar al 1-minuto redujo el riesgo en 23% (OR =
0,77).
- Una semana adicional de edad de gestacin redujo el riesgo en 12% (OR= 0,88).
- La presencia de malformacin congnita tuvo el mayor efecto de entre todas las variables
predictoras (factores de riesgo)(OR=30,55) aumentando notablemente el riesgo de
mortalidad neonatal.

RRR = [ 1 RR ] * 100

C aptulo 12

Pgina 1214

Variables DUMMY (indicadoras)


Para la introduccin de variables policotmicas en el anlisis multivariante es necesario
crear las llamadas variables dummy. Siempre se elegir una categora de referencia
con la que se compararan el resto de las categoras. Si la variable tiene k categoras, se
proponen k - 1 variables dummy al modelo multivariante.
Hosmer and Lemeshow del Baystate Medical Center realizaron un estudio para conocer
los principales factores de riesgo asociados con el bajo peso del RN (definido como peso <
2500 g) en un grupo de 189 mujeres. Una de las 11 variables predictoras evaluadas fue la
RAZA, la cual tena 3 categoras (negra, blanca e hispana).
Para la variable RAZA se tienen que proponer dos variables dummy.
Cmo se formularon esas dos nuevas variables?

C aptulo 12

Anlisis bivariante previo


Relacin entre la variable predictora RAZA y la prevalencia del bajo peso al nacer.

Bajo peso del RN


RAZA

SI

NO

Total

(%)

Blanca

23

73

96

24%

Hispana

25

42

67

37%

Negra

11

15

26

42%

TOTAL

59

130

189

Test de 2 Pearson

= 5,005

p = 0,082

NO existe asociacin

Pgina 1215

C aptulo 12

Anlisis bivariante previo


Relacin entre la variable predictora RAZA y la prevalencia del bajo peso al nacer.

Bajo peso del RN


RAZA

SI

NO

Total

(%)

Blanca

23

73

96

24%

Otras razas

36

57

93

39%

TOTAL

59

130

189

Test de 2 Pearson

= 4,787

p = 0,029

Existe asociacin

Pgina 1216

C aptulo 12

Anlisis bivariante previo


Relacin entre la variable predictora RAZA y la prevalencia del bajo peso al nacer.

Bajo peso del RN

Caso-control

RAZA

SI

NO

Total

(%)

OR

Blanca

23

73

96

24%

1,00

Hispana

25

42

67

37%

1,89

Negra

11

15

26

42%

2,33

TOTAL

59

130

189

Test de 2 de tendencia lineal

= 4,68

p = 0,030

Existe asociacin

TOTAL

Pgina 1217

C aptulo 12

Edad de la madre

HTA durante el embarazo

Hbito tabquico materno


durante el embarazo

Bajo peso
del RN

Trabajo prematuro de parto

Raza materna

N de visitas al gineclogo
durante el primer trimestre

Peso de la madre

Irritabilidad uterina

Pgina 1218

C aptulo 12

Variables predictoras significativas en el anlisis


multivariante
Hbito tabquico materno
durante el embarazo

Bajo peso
del RN
Raza materna

Peso de la madre
Log

P
1-P

= 0

+ 1X1 + 2X2 + 3X3

Hosmer and Lemeshow (2000) Applied Logistic Regression: Second Edition. Baystate Medical Center,
Springfield, Massachusetts .

Pgina 1219

C aptulo 12

Pgina 1220

Modelo de regresin logstico para el BAJO PESO AL NACER


Variables predictoras

Estimacin

Error estndar EE

/EE

Constante

-0,109

0,882

0,123

0,901

Tabaquismo

1,060

0,378

2,804

0,005

Peso de la madre

-0,027

0,013

2,077

0,036

Raza negra (1 dummy)


(NEGRA=1, blanca =0,
hispana=0)

1,290

0,511

2,525

0,012

Raza hispana (2 dummy)


(HISPANA=1, blanca =0,
negra=0)

0,970

0,412

2,354

0,019

Para la variable RAZA se tienen que proponer dos variables dummy (k-1). La categora de referencia es la
que no tiene variable dummy propia, en esta caso la raza blanca.

C aptulo 12

REGRESIN LINEAL
MLTIPLE

REGRESIN LOGSTICA
MULTIVARIANTE

Variable
RESULTADO

Cuantitativa

Cualitativa
(dicotmica)

Variables
PREDICTORAS

Cualitativa
Cuantitativa

Cualitativa
Cuantitativa

ECUACIN

Y = 0 + 1X1 + ... + nXn

Pgina 1221

C aptulo 12

Pgina 1222

Regresin lineal mltiple


Se utiliza la regresin lineal mltiple cuando estudiamos la posible relacin
entre varias variables predictoras Xi (independientes o explicativas) y una
variable resultado (respuesta, dependiente, explicada ) que es siempre de tipo
numrico (cuantitativa).

Y = 0 + 1X1 + ... + nXn

C aptulo 12

Regresin lineal mltiple

Y = 0 + 1X1 + ... + nXn


Variable Predictora 1
Variable Predictora 2
Variable Predictora 3
Variable Predictora 4
Variable Predictora 5
Variable Predictora n

Variable Resultado

Cuantitativa

Pgina 1223

C aptulo 12

Utilidades de la regresin lineal mltiple

- Prediccin de respuestas (variable resultado) a partir de un conjunto de


variables explicativas (predictoras).
- Identificacin de variables predictoras y construccin del modelo de
regresin lineal mltiple.
- Deteccin de interacciones entre las distintas variables predictoras que
afectan a la variable resultado.
- Identificacin (y ajuste) de variables predictoras que actan como
FACTORES de CONFUSIN.

Pgina 1224

C aptulo 12

Pgina 1225

Requisitos para el uso de la regresin lineal mltiple

1. Linealidad.
La variable RESULTADO depende linealmente de las variables
PREDICTORAS.
Si encontramos respuestas no-lineales, esas variables predictoras se pueden
transformar en lineales.
2. Normalidad de las variables cuantitativas.

C aptulo 12

Pgina 1226

Modelo de la regresin lineal mltiple


Y = 0 + 1X1 + ... + nXn
- Y es la variable resultado o dependiente (debe ser siempre numrica).
- Los trminos Xi son las variables predictoras o independientes o explicativas,
las cuales pueden ser
- Cuantitativas (discretas o continuas).
- Cualitativas dicotmicas; en este caso deben transformarse en
cuantitativas ( 0,1 ).
- Cualitativas policotmicas; en este caso deben transformarse en
cuantitativas ( 0,1 ), son las variables dummy.
- Los trminos i son los coeficientes de regresin del modelo y los calcula el
programa estadstico.

C aptulo 12

Pregunta de investigacin
Existe relacin entre la intensidad del estudio y el rendimiento
acadmico en el examen del curso de Bioestadstica?

Variable PREDICTORA 1
Cuantitativa continua
Horas de estudio

Cul es el test estadstico ms acertado?

Variable RESULTADO
Cuantitativa discreta
Rendimiento acadmico

Pgina 1227

C aptulo 12

Modelo de regresin lineal simple para la variable resultado nmero de RESPUESTAS


correctas del examen ajustado por la variable predictora nmero de horas de ESTUDIO
Resumen del modelo
Modelo

R2

R 2 corregido

Error estndar de la estimacin

Regresin

0,629

0,396

0,321

6,506

ANOVA
Modelo

Suma de cuadrados g.l

Media Cuadrtica

Regresin

222,234

222.234

5,250

0,051

Residual

338,666

42,333

Total

560,900

Coeficientes
Variables

Coeficiente

Constante

9,662

2,496

3,871

0,005

Horas de estudio

0,167

0,073

2,291

0,051

Pgina 1228

C aptulo 12

Anlisis multivariante
Variable predictora 1: Cuantitativa
Horas de estudio

Variable resultado:
Cuantitativa
Interaccin

Variable predictora 2: Cuantitativa


Coeficiente intelectual

Rendimiento acadmico

Pgina 1229

C aptulo 12

Pregunta de investigacin
Existe relacin entre el nmero de horas de estudio, el coeficiente intelectual del alumno y el rendimiento acadmico en el
examen del curso de Bioestadstica?
N del Alumno

Horas de estudio (X1) CI del alumno estudio (X 2)

N respuestas correctas (Y)

104

125

16

17

115

18

100

100

21

140

21

112

29

130

20

125

15

10

100

122

22

Cul es el test estadstico ms acertado?

Pgina 1230

C aptulo 12

Pgina 1231

Modelo de regresin lineal MLTIPLE para la variable resultado nmero de RESPUESTAS


correctas del examen ajustado por las variables predictoras nmero de horas de ESTUDIO
y coeficiente intelectual CI
Resumen del modelo
Modelo

R2

R 2 corregido

Error estndar de la estimacin

Regresin

0,948

0,899

0,870

2,842

ANOVA
Modelo

Suma de cuadrados g.l

Media Cuadrtica

Regresin

504,363

252,182

31,224

0,000

Residual

56,537

8,077

Total

560,900

Coeficientes
Variables

Coeficiente

Constante

- 41,153

8,667

- 4,748

0,002

Horas de estudio

0,096

0,034

2,836

0,001

Coeficiente intelectual

0,445

0,075

5,910

0,0025

C aptulo 12

Pgina 1232

Mito 1: La sonrisa de la esfinge


Para la realizacin del modelo de la regresin lineal mltiple es necesario que las
variables incluidas cumplan la normalidad.
Qu test de normalidad has utilizado?
Con independencia de la normalidad, los test paramtricos NO se recomiendan cuando el
tamao muestras es pequeo (n 10),y/o cuando la variables cuantitativa es discreta.
Ests seguro que se cumplen estas condiciones?

C aptulo 12

Pgina 1233

Realidad 1: Respuesta de Edipo


Test de Kolmogorov-Smirnov
Variables

Estadstico

Significacin

Horas de estudio

0,881

10

0,420

Coeficiente intelectual

0,648

10

0,795

Rendimiento acadmico

0,439

10

0,991

Ho: p > 0,05 test paramtricos

Ha: p < 0,05 test NO paramtricos

El test de normalidad ensayado da un valor de p NO significativo (p >0,05) en las 3


variables evaluadas. Por tanto no hay evidencias suficientes para rechazar la hiptesis nula
de normalidad. Podemos utilizar test paramtricos.

C aptulo 12

Realidad 1: Respuesta de Edipo

Distribucin paramtrica del coeficiente intelectual en la poblacin

Pgina 1234

C aptulo 12

Realidad 1: Respuesta de Edipo

CI Score Distribucin

Porcentaje
de poblacin

CI Score Distribucin

Distribucin paramtrica del coeficiente intelectual en la poblacin

Pgina 1235

C aptulo 12

Distribucin paramtrica del coeficiente intelectual en la poblacin

Pgina 1236

C aptulo 12

Mito 1: La sonrisa de la esfinge


Para la aplicacin del modelo de la regresin lineal mltiple es
necesario que NO exista COLINEALIDAD entre las variables
predictoras.
Variable PREDICTORA 1
Cuantitativa continua
Horas de estudio

Existe COLINEALIDAD?

Variable PREDICTORA 2
Cuantitativa discreta
Coeficiente intelectual

Pgina 1237

C aptulo 12

Pgina 1238

Colinealidad en la regresin lineal mltiple

- Es uno de los problemas ms importantes que se puede encontrar en un anlisis de


regresin. Si en un modelo de Regresin Lineal Mltiple alguna variable predictora es
combinacin lineal de otras variables predictoras, el modelo es irresoluble.
- La colinealidad aparece cuando alguna variable predictora es casi combinacin lineal de
otra u otras variables predictoras, es decir sus coeficientes de correlacin simple o mltiple
entre las variables predictoras son cercanos a 1, aunque no llegan a dicho valor.
- Como medida de la misma hay varios estadsticos propuestos, los ms sencillos son los
coeficientes de determinacin (r2) de cada variable predictoras con todas las dems.

C aptulo 12

Diagnstico de colinealidad (1):

- FACTOR DE INFLACIN DE LA VARIANZA (FIV)


FIV > 10: Colinealidad (*)
FIV =

1
1 - R 2j

- TOLERANCIA (T)
T < 0,1: Colinealidad (*)
T=

1
FIV

= 1 - R 2j

(*) Regla emprica de Kleinbaum

Pgina 1239

C aptulo 12

Diagnstico de colinealidad (1):


Modelo

R2

R 2 corregido

Error estndar de la estimacin

Regresin

0,948

0,899

0,870

2,842

Variable resultado: Nmero de respuestas correctas


FIV =

T=

FIV (estudio-CI) = 9,90

1 - R 2j

1
FIV

= 1 - R 2j

NO hay colinealidad

T (estudio-CI) = 0,101

Pgina 1240

C aptulo 12

Diagnstico de colinealidad (2) SPSP


Ruta con SPSS: Opcin: Anlisis, Regresin lineal, Estadsticos

Pgina 1241

C aptulo 12

Diagnstico de colinealidad (2)


NDICE DE CONDICIN: Regla emprica (Belsley):
- ndices de condicin < 5 : NO existe colinealidad.
- ndices de condicin entre 5 y 10: colinealidad dbil.
- ndices de condicin entre 10 y 30: colinealidad moderada.
- ndices de condicin > 30 colinealidad fuerte (grave).

Modelo

Dimensin

Autovalor

ndice de
condicin

Proporciones de la varianza
Constante

Horas de
Estudio

CI

2,456

1,000

0,00

0,06

0,00

0,536

2,136

0,00

0,84

0,00

0,005

21,608

1,00

0,10

1,00

Variable resultado: Nmero de respuestas correctas

Pgina 1242

C aptulo 12

Diagnstico de colinealidad (2)


- Hay un ndice de condicin alto (21,6) y asociado con el mismo est el trmino
constante y el coeficiente intelectual (CI) con proporcin de varianza alta.
- Nos indica, por tanto, que el CI slo es colineal con la constante, pero no con las
horas de estudio.
Modelo

Dimensin

Autovalor

ndice de
condicin

Proporciones de la varianza
Constante

Horas de
Estudio

CI

2,456

1,000

0,00

0,06

0,00

0,536

2,136

0,00

0,84

0,00

0,005

21,608

1,00

0,10

1,00

Variable resultado: Nmero de respuestas correctas

NO hay colinealidad

Pgina 1243

C aptulo 12

Pgina 1244

Pregunta de investigacin
Existe relacin entre el nmero de horas de estudio, el coeficiente intelectual del alumno, asistencia a clases (horas) y el rendimiento acadmico en el examen del curso de Bioestadstica?
N del Alumno

Horas de estudio (X1) CI del alumno Horas de Asistencia


(X 2)
a clase (X3)

N respuestas
correctas (Y)

104

23

125

92

16

17

115

78

18

100

15

100

20

21

140

100

21

112

35

29

130

95

20

125

75

15

10

100

122

100

22

C aptulo 12

Variable predictora 1: Cuantitativa


Horas de estudio

Variable predictora 2: Cuantitativa


Coeficiente intelectual

Variable predictora 3: Cuantitativa


Horas de asistencia a clases

Variable resultado:
Cuantitativa
Rendimiento acadmico

Pgina 1245

C aptulo 12

Pgina 1246

Modelo de regresin lineal MLTIPLE para la variable resultado nmero de RESPUESTAS


correctas del examen ajustado por las variables predictoras nmero de horas de
ESTUDIO, coeficiente intelectual CI y asistencia a clase
Resumen del modelo
Modelo

R2

R 2 corregido

Error estndar de la estimacin

Regresin

0,984

0,969

0,954

1,696

ANOVA
Modelo

Suma de cuadrados g.l

Media Cuadrtica

Regresin

543,632

181,211

62,963

0,000

Residual

17,268

8,077

Total

560,900

Coeficientes
Variables

Coeficiente

Constante

- 2,593

11,651

0.0223

0,831

Horas de estudio

0,028

0,104

1,007

0,353

Coeficiente intelectual

0,022

0,123

0,177

0,865

Asistencia a clase (horas)

0,196

0,053

3,694

0,010

C aptulo 12

Variables

Estadsticos de colinealidad
Tolerancia (T)

FIV

Horas de estudio

0,477

2,098

Coeficiente intelectual

0,117

8,552

Asistencia a clase (horas)

0,89

11,241

Obsrvese que los mayores valores de la tolerancia (T) y del factor de inflacin
corresponden a la variable predictora ASISTENCIA a clase.
- FACTOR DE INFLACIN DE LA VARIANZA (FIV)
FIV > 10: Colinealidad (*)
- TOLERANCIA (T)
T < 0,1: Colinealidad (*)

Pgina 1247

C aptulo 12

Autovalor

ndice de condicin

Proporciones de la varianza
Constante

Horas de
ESTUDIO

Coeficiente
intelectual

ASISTENCIA
a clases

3.366

1,000

0,00

0,02

0,00

0,00

0,538

2,501

0,00

0,45

0,00

0,00

0,095

5.957

0,00

0,24

0,00

0,14

0,001

64,725

0,99

0,29

1,00

0,85

Variable resultado: Rendimiento acadmico (respuestas acertadas)

Hay un ndice de condicin alto (64,72) y asociado con el mismo hay dos variables
(el trmino constante, coeficiente intelectual, y ASISTENCIA a clase) con proporcin
de varianza alta. Nos indica, por tanto, que la asistencia a clase es COLINEAL con el
coeficiente intelectual y con la constante.

Pgina 1248

C aptulo 12

Grasas TOTALES
Colesterol diettico
cidos grasos saturados
cidos grasos insaturados

EDAD
EJERCICIO FSICO

Colesterol-LDL

Pgina 1249

C aptulo 12

Pgina 1250

Realizando los anlisis de regresin de cada una de las variables predictoras


del modelo con todas las dems, se obtienen los siguientes coeficientes de
determinacin, tolerancia y factores de inflacin de la varianza que indican
graves problema de COLINEALIDAD.
Coeficientes no
estandarizados

Significacin

Modelo

EE

Constante

258,484

130,837

1,976

0,70

Grasa TOTAL

- 5,714

4,776

-1,196

Colesterol dieta

0,067

0,036

Edad

0,443

Ejercicio

Estadsticos de
colinealidad
Tolerancia

FIV

0,253

0,20

49,978

1,851

0,087

0,038

26,530

2,867

0,155

0,879

0,098

10,225

- 3,115

45,953

- 0,068

0,947

0,143

7,005

cidos grasos
saturados

0,0722

0,075

0,966

0,351

0,066

15,242

cidos grasos
Insaturados

- 0,0746

1,150

- 0,065

0,949

0,130

7,683

Variable resultado colesterol-LDL

C aptulo 12

Pgina 1251

Obsrvese que el factor de inflacin mayor corresponde a la variable grasas


TOTAL, resultado esperable debido a que se han creado tres variables ms
(colesterol diettico, cidos grasos saturados y cidos grasos insaturados) a
partir de ella.
Autovalor ndice de
condicin

Proporciones de la varianza
Constante

Edad

Grasas
totales

Ejercicio Colesterol cidos


diettico
grasos
insaturados

cidos
grasos
saturados

5,276

1,000

0,00

0,00

0,00

0,00

0,00

0,00

0,00

1,055

2,236

0,00

0,00

0,00

0,03

0,00

0,03

0,00

0,519

3,190

0,00

0,01

0,00

0,02

0,02

0,00

0,00

0,100

7,250

0,03

0,01

0,00

0,06

0,01

0,20

0,04

0,0354

12,200

0,06

0,00

0,00

0,78

0,03

0,64

0,04

0,01207

20,908

0,02

0,41

0,05

0,02

0,31

0,05

0,23

0,00205

50,781

0,89

0,58

0,95

0,09

0,64

0,07

0,69

Variable resultado: Colesterol-LDL

C aptulo 12

Autovalor ndice de
condicin

Proporciones de la varianza
Constante

Edad

Grasas
totales

Ejercicio Colesterol cidos


diettico
grasos
insaturados

cidos
grasos
saturados

5,276

1,000

0,00

0,00

0,00

0,00

0,00

0,00

0,00

1,055

2,236

0,00

0,00

0,00

0,03

0,00

0,03

0,00

0,519

3,190

0,00

0,01

0,00

0,02

0,02

0,00

0,00

0,100

7,250

0,03

0,01

0,00

0,06

0,01

0,20

0,04

0,0354

12,200

0,06

0,00

0,00

0,78

0,03

0,64

0,04

0,01207

20,908

0,02

0,41

0,05

0,02

0,31

0,05

0,23

0,00205

50,781

0,89

0,58

0,95

0,09

0,64

0,07

0,69

Pgina 1252

Variable resultado: Colesterol-LDL

Hay un ndice de condicin alto (50,781) y asociado con el mismo hay cinco variables
(el trmino constante, EDAD, GRASAS TOTALES, COLESTEROL diettico, y cidos
grasos SATURADOS) con proporcin de varianza alta. Nos indica, por tanto, que Grasas
TOTALES es COLINEAL con el COLESTEROL diettico, cidos grasos SATURADOS,
EDAD y con la constante. Al existir esta ltima colinealidad, el centrado de variables podra
mejorar el problema, se podra tambin renunciar a estudiar los trminos no lineales
COLESTEROL diettico y cidos grasos SATURADOS.

C aptulo 12

Edad de la madre

HTA durante el embarazo

Hbito tabquico materno


durante el embarazo

Peso
del RN

Trabajo prematuro de parto

Raza materna

N de visitas al gineclogo
durante el embarazo

Peso de la madre

ITU durante la gestacin

Pgina 1253

C aptulo 12

Pgina 1254

Interpretacin prctica de los resultados de la regresin lineal


mltiple
Coefficientsa

Model
1

(Constant)
Edad de la madre
Hbito tabquico materno
Hipertensin durante el
embarazo
Infeccion urinaria en la
gestacin
Raza materna (blanca vs
otras)
Peso de la madre en Kg
N de visitas en el
embarazo categorizada
Trabajo prematuro de
parto

Unstandardized
Coefficients
Std. Error
B
315,998
2975,284
9,544
-1,919
106,977
-338,413

Standardized
Coefficients
Beta

-573,555

95% Confidence Interval for B


Lower Bound Upper Bound
3598,820
2351,748
16,914
-20,752
-127,322
-549,503

-,014
-,227

t
9,416
-,201
-3,163

Sig.
,000
,841
,002

200,591

-,192

-2,859

,005

-969,369

-177,742

-488,353

136,959

-,239

-3,566

,000

-758,604

-218,102

-380,931

104,245

-,262

-3,654

,000

-586,630

-175,232

8,055

3,570

,155

2,256

,025

1,010

15,100

-11,248

99,741

-,008

-,113

,910

-208,059

185,563

-203,230

136,333

-,102

-1,491

,138

-472,247

65,787

a. Dependent Variable: Peso del RN


ANOVAb
Model
1

Regression
Residual
Total

Sum of
Squares
24747080
75169973
99917053

df
8
180
188

Mean Square
3093384,997
417610,959

F
7,407

Sig.
,000a

a. Predictors: (Constant), Trabajo prematuro de parto, Hipertensin durante el


embarazo, Raza materna (blanca vs otras), N de visitas en el embarazo
categorizada, Infeccion urinaria en la gestacin, Peso de la madre en Kg, Edad de

C aptulo 12

Modelo de regresin logstico para el BAJO PESO AL NACER


Variables predictoras

Estimacin

Error
/EE
estndar EE t

Constante

2975,28

315,998

9,416

0,000

Edad de la madre

-1,919

9,544

-0,201

0,841

Hbito tabquico materno

-338,413

106,977

-3,163

0,002

Hipertensin durante el embarazo

-573,555

200,591

-2,859

0,005

Infeccin urinaria durante el embarazo

488,353

136,959

-3,566

0,000

Raza materna (blanca versus otras)

-380,931

104,245

-3,654

0,000

Peso de la madre en Kg

8,055

3,570

2,256

0,025

N visitas al gineclogo categorizada

-11,248

99,741

-0,113

0,910

Trabajo prematuro de parto

-203,230

136,333

-1,491

0,138

Pgina 1255

C aptulo 12

t = - 3,163
p = 0,002

Hbito tabquico materno


durante el embarazo

t = - 2,859
p = 0,005

HTA durante el embarazo


t = - 3,654
p = 0,000

Peso
del RN

Raza materna
t = 2,256
p = 0,025

Peso de la madre

t = - 3,566
p = 0,000

ITU durante la gestacin

Pgina 1256

C aptulo 12

Pgina 1257

Interpretacin prctica de los resultados de la regresin


lineal mltiple
- La aceptacin de la Ho (p > 0,05) implica que la variable resultado Y no est influenciada
por las variables predictoras Xi incluidas en el modelo.
- La aceptacin de la Ha (p < 0,05) supone que hay algn tipo de influencia de algunas de
las variables predictoras Xi sobre la variable resultado.
- La significacin estadstica se realiza mediante el test de contraste de hiptesis del
anlisis de la varianza (ANOVA).
ANOVAb
Model
1

Regression
Residual
Total

Sum of
Squares
24747080
75169973
99917053

df
8
180
188

Mean Square
3093384,997
417610,959

F
7,407

Sig.
,000a

a. Predictors: (Constant), Trabajo prematuro de parto, Hipertensin durante el


embarazo, Raza materna (blanca vs otras), N de visitas en el embarazo
categorizada, Infeccion urinaria en la gestacin, Peso de la madre en Kg, Edad de
la madre, Hbito tabquico materno
b. Dependent Variable: Peso del RN

Significacin estadstica
del modelo de regresin

C aptulo 12

Interpretacin prctica de los resultados de la regresin


lineal mltiple
- Los programas estadsticos como el SPSS ofrecen una estimacin de los distintos
coeficientes de regresin i , junto al:
- Error estndar de los coeficientes de regresin EEi.
- Significacin estadstica (valor de p) de i cada variable predictora.
- Un intervalo de confianza (IC95%) de los coeficientes de regresin i.
- Las variables predictoras con significacin estadstica (p < 0,05) deben quedar en el
modelo multivariante y en la ecuacin que predice a la variable resultado.
- Las variables predictoras sin significacin estadstica (p > 0,1) deben ser excluidas del
modelo final.

Pgina 1258

C aptulo 12

EEi

i
Model
1

(Constant)
Edad de la madre
Hbito tabquico materno
Hipertensin durante el
embarazo
Infeccion urinaria en la
gestacin
Raza materna (blanca vs
otras)
Peso de la madre en Kg
N de visitas en el
embarazo categorizada
Trabajo prematuro de
parto

IC95%i

Coefficientsa

Unstandardized
Coefficients
Std. Error
B
315,998
2975,284
9,544
-1,919
106,977
-338,413

Standardized
Coefficients
Beta

-573,555

Pgina 1259

95% Confidence Interval for B


Lower Bound Upper Bound
3598,820
2351,748
16,914
-20,752
-127,322
-549,503

-,014
-,227

t
9,416
-,201
-3,163

Sig.
,000
,841
,002

200,591

-,192

-2,859

,005

-969,369

-177,742

-488,353

136,959

-,239

-3,566

,000

-758,604

-218,102

-380,931

104,245

-,262

-3,654

,000

-586,630

-175,232

8,055

3,570

,155

2,256

,025

1,010

15,100

-11,248

99,741

-,008

-,113

,910

-208,059

185,563

-203,230

136,333

-,102

-1,491

,138

-472,247

65,787

a. Dependent Variable: Peso del RN

C aptulo 12

Pgina 1260

Interpretacin prctica de los resultados de la regresin


lineal mltiple
- El trmino estadstico R cuadrado (R2) es el porcentaje de reduccin de la incertidumbre
sobre la variabilidad de la variable RESULTADO (respuesta) cuando son conocidas las
variables PREDICTORAS. Cuanto ms se acerque a 1 ms poder explicativo tiene el
modelo.
- La R cuadrado corregida es un resultado ajustado, que penaliza la introduccin de
variables innecesarias en el modelo, es decir, disminuye su valor cuando se introducen
variables que no actan sobre la variable resultado.

R2 (R Square o bondad del ajuste)


Model
1

Model Summary

R
R Square
,498a
,248

Adjusted
R Square
,214

R2 corregida (ajustada)
Std. Error of
the Estimate
646,228

a. Predictors: (Constant), Trabajo prematuro de parto,


Hipertensin durante el embarazo, Raza materna
(blanca vs otras), N de visitas en el embarazo
categorizada, Infeccion urinaria en la gestacin, Peso
de la madre en Kg, Edad de la madre, Hbito
tabquico materno

C aptulo 12

Pgina 1261

Interpretacin prctica de los resultados de la regresin


lineal mltiple
- La tabla o matriz de correlaciones es de gran inters para identificar correlaciones
lineales entre parejas de variables cuantitativas.
- Interesante si ocurre entre la variable resultado y alguna de las variables predictoras.
- Problemtico si ocurre entre dos variables predictoras porque indica COLINEALIDAD.
- La matriz est formada por todos los coeficientes de correlacin lineal de Pearson (r) para
cada par de variables cuantitativas del estudio.
Coefficient Correlationsa

Model
1

Correlations

Covariances

Trabajo prematuro de
parto
Hipertensin durante el
embarazo
Raza materna (blanca vs
otras)
N de visitas en el
embarazo categorizada
Infeccion urinaria en la
gestacin
Peso de la madre en Kg
Edad de la madre
Hbito tabquico materno
Trabajo prematuro de
parto
Hipertensin durante el
embarazo
Raza materna (blanca vs
otras)
N de visitas en el
embarazo categorizada
Infeccion urinaria en la
gestacin
Peso de la madre en Kg
Edad de la madre
Hbito tabquico materno

a. Dependent Variable: Peso del RN

Trabajo
prematuro
de parto

Hipertensin
durante el
embarazo

Raza materna
(blanca vs
otras)

N de visitas
en el
embarazo
categorizada

Infeccion
urinaria en la
gestacin

Peso de la
madre en Kg

Edad de
la madre

Hbito
tabquico
materno

1,000

-,050

-,126

,074

-,174

,113

-,150

-,218

-,050

1,000

-,053

-,065

,092

-,240

,043

-,025

-,126

-,053

1,000

-,164

-,014

,045

,192

,370

,074

-,065

-,164

1,000

-,042

,028

,165

-,199

-,174

,092

-,014

-,042

1,000

,091

,061

-,020

,113
-,150
-,218

-,240
,043
-,025

,045
,192
,370

,028
,165
-,199

,091
,061
-,020

1,000
-,170
,023

-,170
1,000
,094

,023
,094
1,000

18586,737

-1365,589

-1791,262

1009,836

-3254,760

55,082

-195,718

-3181,035

-1365,589

40236,901

-1118,575

-1306,095

2519,927

-171,932

81,982

-525,956

-1791,262

-1118,575

10866,947

-1707,605

-200,116

16,866

190,755

4124,674

1009,836

-1306,095

-1707,605

9948,197

-574,052

9,929

156,628

-2124,941

-3254,760

2519,927

-200,116

-574,052

18757,679

44,682

80,006

-292,270

55,082
-195,718
-3181,035

-171,932
81,982
-525,956

16,866
190,755
4124,674

9,929
156,628
-2124,941

44,682
80,006
-292,270

12,745
-5,795
8,723

-5,795
91,092
95,883

8,723
95,883
11444,113

C aptulo 12

Pgina 1262

Mito 1: La sonrisa de la esfinge

En la regresin lineal mltiple realizado se han incluido inicialmente 8 posibles


variables predictoras de la variable resultado (peso del RN). De ellas slo 5
han quedado en el modelo final.
Ests seguro que se ha realizado una completa y actualizada revisin
bibliogrfica?
Por qu no se ha tenido en cuenta en el modelo de regresin la variable
DIABETES GESTACIONAL que es ampliamente conocido que aumenta el
peso del RN causando macrosomas?

C aptulo 12

Pgina 1263

Estudio transversal en pacientes con diabetes mellitus


Objetivo: Evaluar la influencia de determinadas variables en el control metablico de
la diabetes mellitus tipo 2.
Variable resultado: Niveles de hemoglobina glicosilada
Variable predictora [1]: Tipo de tratamiento
Variable predictora [2]: Sexo del paciente
Variable predictora [3]: Aos desde el diagnstico de la enfermedad
Variable predictora [4]: Nmero de enfermedades relacionadas con la diabetes
Variable predictora [5]: Acceso al dietista
Variable predictora [6]: Mdico interesado por la diabetes (actitud y conocimiento)
Variable predictora [7]: Nivel socioeconmico
Variable predictora [8]: Estilos de vida (tabaco, alcohol)
Variable predictora [9]: Edad del mdico
Variable predictora [10]: Sexo del mdico

Y = 0 + 1X1 + ... + nXn

C aptulo 12

Anlisis bivariante:
Existe relacin entre el tipo de tratamiento y los niveles de
hemoglobina glicosilada?
Variable PREDICTORA 1
Cualitativa policotmica

Variable RESULTADO
Cuantitativa continua

Tipo de tratamiento
- Dieta
- Insulina
- ADO

%HbA1c

Cul es el test estadstico ms acertado?


Anlisis de la Varianza para un factor (ANOVA) p < 0,05

Pgina 1264

C aptulo 12

Anlisis bivariante:
Existe relacin entre el sexo del paciente y los niveles de
hemoglobina glicosilada?
Variable PREDICTORA 2
Cualitativa dicotmica

Variable RESULTADO
Cuantitativa continua

Sexo del paciente

%HbA1c

Cul es el test estadstico ms acertado?


T de Student para muestras independientes

p < 0,05

Pgina 1265

C aptulo 12

Pgina 1266

Anlisis bivariante:
Existe relacin entre los aos desde el diagnstico de la enfermedad
y los niveles de HbA1c?
Variable PREDICTORA 3
Cuantitativa continua

Variable RESULTADO
Cuantitativa continua

Aos desde el diagnstico


de la enfermedad

%HbA1c

Cul es el test estadstico ms acertado?


Coeficiente de correlacin de Pearson p < 0,05

C aptulo 12

Pgina 1267

Anlisis bivariante:
Existe relacin entre los aos desde el diagnstico de la enfermedad
y los niveles de HbA1c?
Variable PREDICTORA 3
Cualitativa dicotmica

Variable RESULTADO
Cuantitativa continua

Aos desde el diagnstico


de la enfermedad
> 7 aos
< 7 aos

%HbA1c

Cul es el test estadstico ms acertado?


T de Student para muestras independientes

p < 0,05

C aptulo 12

Pgina 1268

Anlisis bivariante:
Existe relacin entre el nmero de enfermedades relacionadas con
la diabetes y los niveles de HbA1c?
Variable PREDICTORA 4
Cuantitativa discreta

Variable RESULTADO
Cuantitativa continua

Nmero de enfermedades
relacionadas con la DM

%HbA1c

Cul es el test estadstico ms acertado?


Coeficiente de correlacin de Spearman p < 0,05

C aptulo 12

Pgina 1269

Anlisis bivariante:
Existe relacin entre el nmero de enfermedades relacionadas con
la diabetes y los niveles de HbA1c?
Variable PREDICTORA 4
Cualitativa dicotmica

Variable RESULTADO
Cuantitativa continua

Nmero de enfermedades
relacionadas con la DM
- Ms de una
- Una o menos de una

%HbA1c

Cul es el test estadstico ms acertado?


T de Student para muestras independientes

p < 0,05

C aptulo 12

Anlisis bivariante:
Existe relacin entre el acceso al dietista y los niveles de
hemoglobina glicosilada?
Variable PREDICTORA 5
Cualitativa dicotmica

Variable RESULTADO
Cuantitativa continua

Acceso al DIETISTA

%HbA1c

Cul es el test estadstico ms acertado?


T de Student para muestras independientes p < 0,05

Pgina 1270

C aptulo 12

Pgina 1271

Anlisis bivariante:
Existe relacin entre la actitud y conocimiento del mdico por la
DM y los niveles de HbA1c?
Variable PREDICTORA 6
Cualitativa dicotmica

Variable RESULTADO
Cuantitativa continua

Mdico interesado
por la DM
- Si
- No

%HbA1c

Cul es el test estadstico ms acertado?


T de Student para muestras independientes

p < 0,05

C aptulo 12

Anlisis bivariante:
Existe relacin entre el nivel socioeconmico del paciente y
los niveles de HbA1c?
Variable PREDICTORA 7
Cualitativa policotmica

Variable RESULTADO
Cuantitativa continua

Nivel socioeconmico

%HbA1c

Cul es el test estadstico ms acertado?


Anlisis de la Varianza para un factor (ANOVA) p > 0,1

Pgina 1272

C aptulo 12

Pgina 1273

Anlisis bivariante:
Existe relacin entre el estilo del vida del paciente y los niveles de
hemoglobina glicosilada?
Variable PREDICTORA 8
Cualitativa dicotmica

Variable RESULTADO
Cuantitativa continua

Estilos de vida
- Adecuados
- Inadecuados
(tabaco, alcohol, etc)

%HbA1c

Cul es el test estadstico ms acertado?


T de Student para muestras independientes

p > 0,1

C aptulo 12

Anlisis bivariante:
Existe relacin entre el sexo del mdico y los niveles de
hemoglobina glicosilada?
Variable PREDICTORA 9
Cualitativa dicotmica

Variable RESULTADO
Cuantitativa continua

Sexo del Mdico

%HbA1c

Cul es el test estadstico ms acertado?


T de Student para muestras independientes p > 0,1

Pgina 1274

C aptulo 12

Anlisis bivariante:
Existe relacin entre el tipo de tratamiento y los niveles de
hemoglobina glicosilada?
Variable PREDICTORA 10
Cuantitativa continua

Variable RESULTADO
Cuantitativa continua
%HbA1c

Edad del Mdico

Cul es el test estadstico ms acertado?


Coeficiente de correlacin de Pearson

p > 0,1

Pgina 1275

C aptulo 12

Acceso al
Dietista hospitalario

Tipo de tratamiento

Sexo del paciente


Aos desde el diagnstico
de la enfermedad
N de enfermedades
relacionadas
con la DM
Nivel socioeconmico

%HbA1c

Actitud y conocimiento de
la DM por parte del mdico
Sexo
del mdico
Edad del mdico

Estilos de vida

Pgina 1276

C aptulo 12

Pgina 1277

Anlisis de regresin lineal mltiple


1. Dummy
Tipo de tratamiento
2. Dummy
Tipo de tratamiento

6. Acceso al
Dietista hospitalario

%HbA1c

3. Sexo del paciente


4. Aos desde el diagnstico
de la enfermedad
5. N de enfermedades
relacionadas
con la DM

Y = 0 + 1X1 + 2X2 + 3X3 + 4X4 + 5X5 + 6X6

7. Actitud y conocimiento de
la DM por parte del mdico

C aptulo 12

Anlisis de regresin lineal mltiple


1.- Tipo de tratamiento

Insulina

Antidiabticos orales (ADO)

Dieta
2.- Sexo del paciente (mujer [1]; hombre [0])
3.- Aos desde el diagnstico de la enfermedad

> 7 aos: [1]

< 7 aos: [0]
4.- Nmero de enfermedades relacionadas con la diabetes

- Ms de una: [1]

- Una o menos de una: [0]
5.- Acceso al dietista (si [1]; no [0])
6- Mdico interesado por la diabetes (si [1]; no [0])

Y = 0 + 1X1 + ... + nXn


Y = 0 + 1X1 + 2X2 + 3X3 + 4X4 + 5X5 + 6X6

Variables predictoras (X)


Variable resultado (Y):
HbA1c(%)

Pgina 1278

C aptulo 12

Pgina 1279

Anlisis de regresin lineal mltiple


Variable resultado (Y):
HbA1c(%)
Variables PREDICTORAS
que estaban relacionadas
estadsticamente con la
variable resultado HbA1c
en el anlisis univariante

Coeficiente de regresin
estandarizado
(t calculada)

sexo
EE sexo

0,72
0,28

Y = 0 + 1X1 + ... + nXn

Variables predictoras (X)

Variables asociadas al nivel de hemoglobina glicosilada


Variables predictoras

Estimacin

Error estndar
EE

Constante

10,51

0,59

1 dummy Antidiabticos orales /


insulina

0,29

0,37

2 dummy Dieta / insulina

-0,97

0,46

N enfermedades relacionadas con la


diabetes (> 1 / 1)

0,20

0,08

Sexo (mujer/hombre)

0,72

0,28

Aos desde el diagnstico (> 7 / 7)

0,04

0,02

Acceso al dietista hospitalario (si/no)

-1,06

0,43

Mdico interesado en la diabetes (si/no)

- 0,86

0,38

= 2,57

> Z95% (1,96)

p < 0,05

C aptulo 12

Mito 1: La sonrisa de la esfinge

En la tabla de la regresin lineal mltiple presentada se han incluido slo el valor de


y su error estndar EE, pero no se ha incluido el IC95% de ni la significacin
estadstica p de cada variable predictora. Tampoco veo la tabla donde se indica el R 2
(R Square o bondad del ajuste del modelo multivariante).
Ests seguro que las 6 variables predictoras incluidas en el modelo multivariante
presentan significacin estadstica (p<0,05)?
La variable 1 dummy ADO/insulina presenta un valor de (0,29) inferior a su error
estndar EE, (0,37) por lo que su cociente vale 0,78, cifra muy inferior al 1,96 (Z95%)
Por qu has incluido en el modelo de regresin la variable ADO/insulina?

Pgina 1280

C aptulo 12

Pgina 1281

Anlisis de regresin lineal mltiple


Variable resultado (Y):
HbA1c(%)
Cul de las distintas variables predictoras incluidas en el modelo parece
afectar ms a la variable
resultado (HbA1c)?

Y = 0 + 1X1 + ... + nXn

Variables predictoras (X)

Variables asociadas al nivel de hemoglobina glicosilada


Variables predictoras

Estimacin

Error estndar
EE

Constante

10,51

0,59

1 dummy Antidiabticos orales /


insulina

0,29

0,37

2 dummy Dieta / insulina

-0,97

0,46

N enfermedades relacionadas con la


diabetes (> 1 / 1)

0,20

0,08

Sexo (mujer/hombre)

0,72

0,28

Aos desde el diagnstico (> 7 / 7)

0,04

0,02

Acceso al dietista hospitalario (si/no)

-1,06

0,43

Mdico interesado en la diabetes (si/no)

- 0,86

0,38

Pgina 1282

C aptulo 12

Anlisis de regresin lineal mltiple


Variable resultado (Y):
HbA1c(%)

Y = 0 + 1X1 + ... + nXn

Variables predictoras (X)

Variables asociadas al nivel de hemoglobina glicosilada


Variables predictoras

Estimacin

Error estndar
EE

Cociente /
EE

Significacin
p

Constante

10,51

0,59

1 dummy Antidiabticos orales / insulina

0,29

0,37

0,78

p > 0,1

2 dummy Dieta / insulina

-0,97

0,46

2,11

p < 0,05

N enfermedades relacionadas con la


diabetes (> 1 / 1)

0,20

0,08

2,5

p < 0,05

Sexo (mujer/hombre)

0,72

0,28

2,57

p < 0,01

Aos desde el diagnstico (> 7 / 7)

0,04

0,02

2,00

p < 0,05

Acceso al dietista hospitalario (si/no)

-1,06

0,43

2,47

p < 0,02

Mdico interesado en la diabetes (si/no)

- 0,86

0,38

2,26

p < 0,05

C aptulo 12

Pgina 1283

Qu diferencia promedio de HBA1c existe entre un


paciente A mujer (sexo=1) y un paciente B hombre
(sexo=0) y a igualdad del resto de las variables predictoras
incluidas en el modelo?
Variables
predictoras

Paciente A

Paciente B

Sexo (mujer=1,
hombre =0)

+0,72

mujer [1]

hombre [0]

Y = 0 + 1X1 + ... + nXn

HbA1c (A)= 10,51 + 0,72 (1) = 11,23


HbA1c (B) = 10,51 + 0,72 (0) = 10,51

Las mujeres presentan 0,72


unidades ms de HbA1c que los
hombres a igualdad del resto de las
variables predictoras incluidas en el
modelo.

C aptulo 12

Qu diferencia promedio de HBA1c existe entre un


paciente A con acceso al dietista hospitalario (1) de un
paciente B sin acceso (0) y a igualdad del resto de las
variables predictoras incluidas en el modelo?
Variables predictoras

Paciente A

Paciente B

Acceso al dietista
hospitalario
(si =1, no =0)

-1,06

SI [1]

NO [0]

Y = 0 + 1X1 + ... + nXn


HbA1c (A)= 10,51 1,06 (1) = 9,45
HbA1c (B) = 10,51 1,06 (0) = 10,51

Los pacientes CON acceso al


dietista por termino medio presentan
1,06 unidades menos de HbA1c
que los pacientes SIN dietista
hospitalario a igualdad del resto de
las variables predictoras incluidas
en el modelo.

Pgina 1284

C aptulo 12

Pgina 1285

Qu diferencia promedio de HBA1c existe entre un


paciente A tratado con ADO (1) de un paciente N tratado
con insulina (0) a igualdad del resto de las variables
predictoras incluidas en el modelo?
Variables predictoras

Paciente A

Paciente N

ADO/insulina
(ADO=1, insulina=0)

+ 0,29

ADO [1]

insulina [0]

Y = 0 + 1X1 + ... + nXn

HbA1c (A)= 10,51 + 0,29 (1) = 10,8


HbA1c (N) = 10,51 + 0,29 (0) = 10,51

Los pacientes en tratamiento con


ADO por termino medio presentan
0,29 unidades ms de HbA1c que
los pacientes tratados con insulina
a igualdad del resto de las variables
predictoras incluidas en el modelo.

C aptulo 12

Pgina 1286

Qu diferencia promedio de HBA1c existe entre un


paciente A tratado slo con DIETA (1) de un paciente B
tratado con insulina (0) a igualdad del resto de las variables
predictoras incluidas en el modelo?
Variables predictoras

Paciente A

Paciente N

Dieta/insulina
(dieta=1, insulina=0)

- 0,97

dieta [1]

insulina [0]

Y = 0 + 1X1 + ... + nXn

HbA1c (D)= 10,51 - 0,97 (1) = 9,54


HbA1c (N) = 10,51 - 0,97 (0) = 10,51

Los pacientes en tratamiento


slo con dieta por termino medio
presentan 0,97 unidades menos de
HbA1c que los pacientes tratados
con insulina a igualdad del resto de
las variables predictoras incluidas
en el modelo.

C aptulo 12

Qu diferencia promedio de HbA1c existe entre dos


pacientes A y B con las siguientes caractersticas?
Variables predictoras

Paciente A

Paciente B

Antidiabticos orales/insulina [1/ 0]

ADO [1]

Insulina [0]

Dieta/insulina [1/ 0]

Dieta [1]

Insulina [0]

N enfermedades relacionadas con la diabetes


(>1/<=1) [1/ 0]

3 [1]

1 [0]

Sexo (mujer/hombre)

Hombre [0]

Mujer [1]

Aos desde el diagnstico (> 7 / 7)

8 aos [1]

3 aos [0]

Acceso al dietista hospitalario (si/no) [1/ 0]

Si [1]

No [0]

Mdico interesado en la diabetes (si/no)

Si [1]

Si [1]

HbA1c A = 10,51 + 0,29 (1) 0,97 (0) + 0,20 (1) + 0,72 (0) + 0,04 (1) 1,06 (1) 0,86 (1) = 9.12%
HbA1c B = 10,51 + 0,29 (0) 0,97 (1) + 0,20 (0) + 0,72 (1) + 0,04 (0) 1,06 (0) 0,86 (1) = 9,40%
Diferencia HbA1c (A-B) = - 0,28%

Pgina 1287

C aptulo 12

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario INGESA de Ceuta

Pgina 1288

C aptulo 12

PC basal

Grupo Cultural

PC post

Tabaco

Colesterol total

Lp(a)

HTA

Colesterol-LDL

Cardiopata isqumica

Apoprotena B

Arteriopata perifrica

Urea

Accidente isqumico
cerebral

Retinopata
Proteinuria

Microalbuminuria

Pgina 1289

C aptulo 12

Anlisis de regresin lineal mltiple


1.- Grupo cultural
Cristianos: [1]
Musulmanes: [0]
2.- Tabaco (si [1]; no [0])
3.- Hipertensin arterial
si: [1]
no: [0]
4.- Cardiopata isqumica
si: [1]
no: [0]
5.- Arteriopata perifrica (si [1]; no [0])
6- Accidente isqumico cerebral (si [1]; no [0])
7.- Retinopata (si [1]; no [0])
8.- Microalbuminuria (si [1]; no [0])
9.- Proteinuria (si [1]; no [0])

Variables predictoras (X)


CUALITATIVAS
Variable resultado (Y):
Lipoprotena a
314 pacientes con
DM tipo 2

Y = 0 + 1X1 + ... + nXn

Amor Garca, Jacobo Daz, Lus Escobar, Manuel Aguilar, Alipio Mangas.
LIPOPROTENA (a) Y DIABETES MELLITUS TIPO 2: FACTORES QUE INFLUYEN EN LAS
CONCENTRACIONES PLASMTICAS Y UTILIDAD COMO MARCADOR DE COMPLICACIONES
TARDAS (Premio AEBM). Revista: Revista de Diagnstico Biolgico 2000; 49: 125-137.

Pgina 1290

C aptulo 12

Anlisis de regresin lineal mltiple


1.- Edad
2.- Peso
3.- IMC
4.- ICC
5.- Tensin arterial sistlica (TAS)
6- Tensin arterial diastlica (TAD)
7.- Glucemia
8.- Pptido C basal (PCB)
9.- Pptido C postprandrial (PCP)
10.- IPC
IPC = PCP - PCB
11.- HbA1c
12.- Colesterol total
13.- Triglicridos
14.- Colesterol-HDL
15.- Colesterol-LDL
16.- Apoprotena A1
17.- Apoprotena B
18.- Urea
19.- Creatinina

Variables predictoras (X)


CUALITATIVAS
Variable resultado (Y):
Lipoprotena a
314 pacientes con
DM tipo 2

Y = 0 + 1X1 + ... + nXn

Amor Garca, Jacobo Daz, Lus Escobar, Manuel Aguilar, Alipio Mangas.
LIPOPROTENA (a) Y DIABETES MELLITUS TIPO 2: FACTORES QUE INFLUYEN EN LAS
CONCENTRACIONES PLASMTICAS Y UTILIDAD COMO MARCADOR DE COMPLICACIONES
TARDAS (Premio AEBM). Revista: Revista de Diagnstico Biolgico 2000; 49: 125-137.

Pgina 1291

C aptulo 12

Anlisis de regresin lineal mltiple


Variables asociadas al nivel de lipoprotena (a)
Variables predictoras
CUALITATIVAS

Estimacin

Error estndar EE

/EE

Test F

Grupo cultural

- 5,1428

2,7270

1,88

3,5564

p > 0,1

Tabaco

0,1952

3,1477

0,062

0,0038

NS

HTA

2,4388

2,5480

0,960

0,9161

NS

Cardiopata isqumica

8,4219

2,8256

2,98

8,9028

p < 0,01

Arteriopata perifrica

3,1005

3,375

0,919

0,8440

NS

AIC

2,041

3,114

0,656

0,4298

NS

Retinopata

- 0,8838

2,6850

0,329

0,1084

NS

Microalbuminuria

0,4571

2,6964

0,169

0,0287

NS

Proteinuria

12,905

4,1180

3,13

9,821

p < 0,005

/ EE: Coeficiente de regresin estandarizado

Pgina 1292

C aptulo 12

Anlisis de regresin lineal mltiple


Variables asociadas al nivel de lipoprotena (a)
Pptido C basal

- 1,863

0,9581

1,94

3,7807

0,051

Pptido C post

- 0,027

0,5067

0,053

0,0029

NS

Colesterol total

0,0638

0,0573

1,113

1,2420

NS

Colesterol-LDL

- 0,0518

0,0628

0,825

0,679

NS

Apoprotena B

0,0242

0,0747

0,324

0,1052

NS

Urea

0,1340

0,0704

1,90

3,6205

p > 0,1

AIC

2,041

3,114

0,656

0,4298

NS

/ EE: Coeficiente de regresin estandarizado

Pgina 1293

C aptulo 12

Lp(a)
Cardiopata isqumica

Proteinuria

Pgina 1294

C aptulo 12

Discusin (parte final)


Por lo tanto, la determinacin de Lp(a) presenta utilidad como marcador de las
complicaciones tardas de la DM tipo 2, y sus concentraciones plasmticas estn
influenciadas de forma directa e independiente por la cardiopata isqumica y la
nefropata. Cabe destacar que a pesar de que el diseo del estudio es transversal y no
permite inferir una relacin causal, si tenemos en cuenta el condicionamiento gentico
de la Lp(a), los resultados sugieren que la elevacin de los niveles plasmticos de
Lp(a) predisponen al enfermo diabtico a la aparicin de complicaciones vasculares,
principalmente la cardiopata isqumica y la nefropata diabtica. A pesar de tratarse de
un estudio con elevado nmero de pacientes, dada la gran variabilidad interindividual
de las concentraciones de Lp(a), estas asociaciones deberan confirmarse en estudios
longitudinales ms amplios y ms a largo plazo que los publicados en la actualidad.

Amor Garca, Jacobo Daz, Lus Escobar, Manuel Aguilar, Alipio Mangas.
LIPOPROTENA (a) Y DIABETES MELLITUS TIPO 2: FACTORES QUE INFLUYEN EN LAS
CONCENTRACIONES PLASMTICAS Y UTILIDAD COMO MARCADOR DE COMPLICACIONES
TARDAS (Premio Nacional AEBM). Revista: Revista de Diagnstico Biolgico 2000; 49: 125-137.

Pgina 1295

C aptulo 12

Pgina 1296

Mito 1: La sonrisa de la esfinge


Segn se desprende en el final de la discusin del estudio, se sugiere que la Lp(a), por su
condicionamiento gentico, podra actuar como variable predictora principal de la aparicin
de algunas complicaciones vasculares como la cardiopata isqumica y la nefropata
diabtica en los pacientes con diabetes tipo 2. Sin embargo en el anlisis multivariante la
has considerado con variable resultado.
Ests seguro que la lipoprotena a es realmente la variable resultado?
No crees que la Lp(a) podra ser la variable predictora principal y la aparicin de algn
tipo complicaciones vasculares la variable resultado?

C aptulo 12

Variable PREDICTORA
Cuantitativa continua
Lp(a)

Variable RESULTADO
Cualitativa dicotmica (s o no)
Complicaciones vasculares
- Cardiopata isqumica
- Proteinuria

Pgina 1297

C aptulo 12

PC basal

Lp(a)

PC post
Colesterol total
Colesterol-LDL
Apoprotena B
Urea
Grupo Cultural
Tabaco
HTA

Complicaciones
vasculares

Pgina 1298

C aptulo 12

Problema clnico: En Atencin Primaria la eficiencia de la determinacin de la excrecin


urinaria de albmina en orina de 24 horas (EUA) para el diagnostico de la nefropata
diabtica es baja.
Objetivo del estudio: Introducir el cociente albmina/creatinina en una muestra de orina
matinal (CAC) como alternativa a la EUA.
Pregunta de investigacin: Podemos sustituir el cociente albmina/creatinina en orina
matinal (CAC) por la excrecin urinaria de albmina (EUA) en orina de 24 horas en
pacientes con sospecha de nefropata diabtica? Qu relacin existe entre el CAC y la
EUA en orina de 24 horas en dichos pacientes?.
Cul es el test estadstico ms acertado?

Pgina 1299

C aptulo 12

Pregunta de investigacin
Qu relacin existe entre el cociente albmina/creatinina en
orina matinal (CAC) y la excrecin urinaria de albmina (EUA)
en orina de 24 horas?
Variable PREDICTORA
Cuantitativa continua
CAC

Variable RESULTADO
Cuantitativa continua
EUA

REGRESIN LINEAL SIMPLE

Y = 0 + 1 * X

Coeficiente de correlacin

r = 0,893 (89,3%)

Pgina 1300

C aptulo 12

Pgina 1301

Coeficiente de correlacin de Pearson


Correlacin global EUA versus CAC

r = 0,893; R2 = 0,806; p < 0,01

COEFICIENTE DE PEARSON: La magnitud de la asociacin entre la EUA y la CAC es del


89,3% de la posible.
COEFICIENTE DE DETERMINACIN: El 80,6% de la variabilidad de la EUA puede
ser explicada por la distinta CAC, resta por explicar un 19,4% que es achacable a otras
variables PREDICTORAS distintas de la CAC.
Cules son esas variables predictoras?
Influencia del SEXO
EUA versus CAC

Correlacin de Pearson r

Sexo masculino

0,753

Sexo femenino

0,979

Las diferencias entre los coeficientes de correlacin para cada sexo (masculino versus
femenino) se pueden analizar por el mtodo de OLKIN.

C aptulo 12

Pgina 1302

El test de Kaiser-Meyer-Olkin (KMO), que mide la idoneidad de los datos para realizar un
anlisis factorial comparando los valores de los coeficientes de correlacin observados con
los coeficientes de correlacin parcial (grupos comparados). Si la suma de los cuadrados
de los coeficientes de correlacin parcial entre todos los pares de variables es pequea
en comparacin con la suma de los coeficientes de correlacin al cuadrado, esta medida
tiende a uno. Para Kaiser los resultados del modelo factorial sern excelentes si el ndice
KMO est comprendido entre 0,9 y 1; buenos, si est comprendido entre 0,8 y 0,9;
aceptables, si se encuentra entre 0,7 y 0,8; mediocres o regulares, cuando resulte entre
0,6 y 0,7; malos, si est entre 0,5 y 0,6; e inaceptables o muy malos cuando sea menor que
0,5.

KMO =

( r global)2
( r global)2 + ( r hombres)2

C aptulo 12

Pgina 1303

El coeficiente de correlacin parcial es un indicador de la fuerza de las relaciones entre


dos variables eliminando la influencia del resto. Si las variables comparten factores
comunes, el coeficiente de correlacin parcial entre pares de variables deber ser bajo,
puesto que se eliminan los efectos lineales de las otras variables.
Una forma de evaluar este hecho es mediante la Medida de Adecuacin de la Muestra
KMO propuesta por Kaiser, Meyer y Olkin. Dicha medida viene dada por la ecuacin KMO
donde rij(p) es el coeficiente de correlacin parcial entre las variables Xi y Xj eliminando la
influencia del resto de las variables.

C aptulo 12

KMO =

( r global)2
(r

2
global)

+ (r

KMO hombres = 0,584

2
hombres)

KMO =

Pgina 1304

( r global)2
( r global)2 + ( r mujeres)2

KMO mujeres = 0,457

KMO es un ndice que toma valores entre 0 y 1 y que se utiliza para comparar las
magnitudes de los coeficientes de correlacin observados con las magnitudes de los
coeficientes de correlacin parcial de forma que, cuanto ms pequeo sea su valor, mayor
es el valor de los coeficientes de correlacin parciales rij(p) y, por lo tanto, menos deseable
es realizar un Anlisis Factorial. Kaise, Meyer y Olkin aconsejan que si KMO 0,75 la idea
de realizar un anlisis factorial es buena, si 0,75 > KMO 0,5 la idea es aceptable y si
KMO < 0,5 es inaceptable.

C aptulo 12

Pgina 1305

Se observa que el valor del KMO = 0.584 para hombres est en el lmite de los valores
recomendados por Kaiser, Meyer y Olkin poniendo de manifiesto que, en este caso muy
probablemente, el proceso de reduccin de datos no sea muy espectacular.
Se observa que el valor del KMO = 0.457 para mujeres es inferior al lmite de los valores
recomendados por Kaiser, Meyer y Olkin (0,5) poniendo de manifiesto que, en este caso
con toda seguridad, el proceso de reduccin de datos no es importante.

C aptulo 12

Pgina 1306

Regresin lineal mltiple


R2 = 0,806 (80,6%)

Factor 1:
Variable predictora 1
CAC
1 = 7.65 p=0,001

Factor 3:
Variable predictora 3

Variable RESULTADO
Cuantitativa continua
EUA

Edad
3= -0.54 p=0,42

Factor 2:
Variable predictora 2
Sexo
2 = -30.26 p=0,01

Aplicacin del modelo de regresin mltiple


a los datos de un estudio que usa como
variables predictoras el cociente albmina/
creatinina en orina matinal (CAC), sexo y
edad del individuo frente a la excrecin
urinaria de albmina en orina 24 horas EUA
(variable resultado).

Pgina 1307

C aptulo 12

Anlisis de regresin lineal mltiple


EUA: Excrecin urinaria de
albmina en orina de 24 horas
CAC: Cociente albmina/creatinina
en una muestra de orina matinal
EUA: Variable dependiente o
resultado
CAC: Variable Predictora 1
SEXO: Variable Predictora 2
EDAD: Variable Predictora 3

Modelo de Regresin Lineal Mltiple


Coeficiente IC95% de

Constante

110,85

13,88 a 187,84

0,02

CAC

7,65

7,13 a 8,16

0,001

Edad

- 0,54

- 1,86 a 0,78

0,42

Sexo

- 30,26

- 53,93 a 6,58 0,01

EUA (Y) = 110,85 + 7,65 CAC - 0,54 EDAD 30,26 SEXO


EUA (Y) = 110,85 + 7,65 CAC 30,26 SEXO

C aptulo 12

Fases del anlisis estadstico


1. ANLISIS DESCRIPTIVO

Qu Variables PREDICTORAS
se deben incluir en el Anlisis de
Regresin Lineal Mltiple?

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE

Variable Predictora 1
Variable Predictora 2
Variable Predictora 3
Variable Predictora 4
Variable Predictora 5
Variable Predictora n

Variable Resultado

Pgina 1308

C aptulo 12

Mtodo de introduccin de las


variables

REGRESIN LINEAL
MLTIPLE

REGRESIN LOGSTICA
MULTIVARIANTE

Forward (hacia adelante)

Introducir progresivamente en el modelo las variables


predictoras estadsticamente significativas, comenzando por
la que tenga mayor significacin

Backward (hacia atrs)

Comienza por estimar un modelo que contiene todas las


variables predictoras para ir eliminando posteriormente
una a una, de forma sucesiva, aquellas que no sean
significativas

Stepwise

Es una combinacin de los anteriores

Pgina 1309

C aptulo 12

HIPERLIPIDEMIA
EDAD
SEXO
NIVEL CULTURAL
TABAQUISMO
OBESIDAD IMC
DIABETES

Excrecin urinaria
de sodio en 24 horas

Pgina 1310

C aptulo 12

Pgina 1311

Qu variables predictoras se deben incluir en el anlisis de


regresin lineal mltiple?
Con significacin estadstica
(p<0,05)
Edad
Sexo
Nivel cultural
Tabaquismo
Prxima a la significacin
estadstica (0,05 < p < 0,1)
- IMC
- Hiperlipidemia

Pgina 1312

C aptulo 12

Anlisis de regresin lineal mltiple


Cul de las distintas variables
predictoras con significacin
estadstica (p<0,05) del anlisis
univariante NO aparecen en el
modelo multivariante?
Nivel cultural
Cul de las distintas variables
predictoras prximas a la
significacin estadstica (0,05
<p<0,1) del anlisis univariante
SI aparecen en el modelo
multivariante?
Obesidad (IMC)

Resultados del anlisis de Regresin Lineal Mltiple


Coeficiente IC95% de

Constante

96,67

19,2 a 174,15

0,015

Edad

- 1,17

- 1,89 a 0,44 0,002

Sexo

28,71

4,65 a 52,78

0,020

Tabaquismo

29,22

3,83 a 54,6

0,024

IMC

4,15

2,00 a 6,29

0,000

La codificacin de las variables dicotmicas se realiz


sexo: mujer = 0, hombre = 1, tabaquismo: no fumador
0, fumador 1). IMC = peso / (talla)2

En el anlisis de regresin lineal MLTIPLE se incluyeron las variables predictoras con


Significacin estadstica en el anlisis de regresin lineal SIMPLE (edad, sexo, nivel cultural,
tabaquismo; p<0,05) y aquellas prximas a la significacin (IMC y hiperlipidemia; p=0,1),
identificndose como verdaderas variables predictoras o independientes slo la edad, sexo,
IMC y el tabaco r=0,388 (p<0,05). El resto de las variables NO fueron incluidas en el modelo.

C aptulo 12

Pgina 1313

Pregunta de investigacin
Qu relacin existe entre los niveles de colesterol en sangre y la
tensin arterial?
Variable PREDICTORA
Cuantitativa continua
Colesterol

Variable RESULTADO
Cuantitativa continua
Tensin arterial

REGRESIN LINEAL SIMPLE

Y = 0 + 1 * X

Coeficiente de correlacin

R2 = 0,691 (69,1%)

C aptulo 12

Pgina 1314

Modelo de regresin lineal simple para la variable resultado tensin


arterial diastlica ajustado por la variable predictora colesterol
Variable

Coeficiente

EE

IC95%

Constante

26,91

7,15

12,63 41,19

3,76

< 0,001

Colesterol

0,23

0,03

0,17 0,29

7,70

< 0,001

Suma de
cuadrados

g.l

Media
Cuadrtica

Regresin

4067,11

4067,11

59,29

< 0,001

Residual

4459,01

65

68,60

Total

8526,12

66

29,22

Y = 0 + 1 * X
TAD = 26.91 + 0.23 * Colesterol
Es el modelo de regresin simple que resulta de tomar como nica variable predictora el colesterol de un
individuo. El valor del coeficiente de determinacin R 2 es 0.691 (69.1%).
Se puede mejorar el R 2 incluyendo otra variable predictora?.
R 2 puede ser mejorado a 0.722 (72.2%) aplicando un modelo multivariante en el que se introduce el ndice
de masa corporal (IMC) como nueva variable predictora.

C aptulo 12

Pgina 1315

Correlacin lineal de las variables predictoras edad, colesterol e ndice


de masa corporal con la variable resultado tensin arterial diastlica

TAD
NS

NS
EDAD
NS
NS

NS

NS

Colesterol

IMC

Prtegas Daz S, Pita Fernndez S. Tcnicas de regresin: Regresin lineal mltiple. Cad Aten Primaria
2000; 7: 173-176.

C aptulo 12

Regresin lineal mltiple


Variable
Predictora 1
Causa o Factor 1: Cuantitativa

Variable RESULTADO
Interaccin

Desenlace o efecto:
Cuantitativa

Variable
Predictora 2
Causa o Factor 2: Cuantitativa

Y = 0 + 1 * X1 + 2 * X2

Pgina 1316

C aptulo 12

Regresin lineal mltiple


R2 = 0,722 (72,2%)
Factor 1:
Variable predictora 1
Colesterol
t= 5.26 p<0,001

Desenlace o efecto
Tensin arterial

Factor 2:
Variable predictora 2
IMC
t= 2.45 p=0,017

Aplicacin del modelo de regresin


mltiple a los datos de un estudio que
usa como variables predictoras de la
tensin diastlica (variable resultado) el
colesterol y el ndice de masa corporal de
un individuo.

Pgina 1317

C aptulo 12

Pgina 1318

Modelo de regresin lineal simple para la variable resultado tensin


arterial diastlica ajustado por las variables predictoras colesterol e
ndice de masa corporal
R2 = 0,722 (72,2%)
Variable

Coeficiente

EE

IC95%

Constante

19,42

7,54

4,37 34,48

2,58

0,012

Colesterol

0,18

0,03

0,11 0,25

5,26

< 0,001

IMC

0,73

0,30

0,14 1,33

2,45

0,017

Suma de
cuadrados

g.l

Media
Cuadrtica

Regresin

4449,72

2224,86

34,93

< 0,001

Residual

4076,40

64

63,69

Total

8526,12

TAD = 19,42 + 0.18 * Colesterol + 0,73 IMC


Los coeficientes de regresin para ambas variables predictoras fueron 0.18 (= 0.03) y 0.73 (=0.30)
respectivamente, siendo ambos significativamente distintos de cero. Esto indica que por trmino medio la
tensin arterial diastlica de un paciente se incrementa en 1.8 y 7.3 respectivamente por cada 10 unidades
a mayores en su colesterol o ndice de masa corporal. El valor del coeficiente de determinacin R 2=0.72
(72%) y la significacin del contraste F global de la regresin (p<0.001) sugieren que gran parte de la
variabilidad de la respuesta (TAD) viene explicada por el modelo ajustado.

C aptulo 12

Pgina 1319

Regresin lineal mltiple


R2 = 0,52 (52%)

Factor 1:
Variable predictora 1
Colesterol
t= 4.84 p<0,001

Factor 3:
Variable predictora 3

Desenlace o efecto
Tensin arterial

Edad
t= 1.67 p=0.10

Aplicacin del modelo de regresin mltiple


a los datos de un estudio que usa como
variables predictoras de la tensin diastlica
(variable resultado) el colesterol, ndice de
masa corporal y edad de un individuo.

Factor 2:
Variable predictora 2
IMC
t= 2.31 p=0,024

C aptulo 12

Pgina 1320

Modelo de regresin lineal simple para la variable resultado tensin


arterial diastlica (TAD) ajustado por las variables predictoras colesterol, ndice de masa corporal y edad
R2 = 0,52 (52%)
Variable

Coeficiente

EE

IC95%

Constante

10,55

9,13

-7,70 a 28,81

1,15

0,252

Colesterol

0,17

0,03

0,1 0,24

4,84

< 0,001

IMC

0,68

0,30

0,09 1,28

2,31

0,024

Edad

0,24

0,14

- 0,05 a 0,53

1,67

0,100

Suma de
cuadrados

g.l

Media
Cuadrtica

Regresin

4622,52

1540,84

24,87

< 0,001

Residual

3903,60

63

61,96

Total

8526,12

66

Los coeficientes de regresin para el colesterol fue 0.17 (= 0.03) y de 0.68 (=0.30) para el IMC
continuarn siendo distintos de cero (p<0.05). La introduccin de la nueva variable predictora EDAD en el
modelo, proporciona un cambio en el coeficiente de determinacin R 2 de tan slo 0.028 que NO mejora de
forma significativa (p=0.059). La entrada de la variable edad NO produce una mejora del ajuste del modelo.
El coeficiente de regresin de la EDAD (0.24) no es significativo (p=0.100).

C aptulo 12

Pgina 1321

Modelo de regresin lineal simple para la variable resultado tensin


arterial diastlica (TAD) ajustado por las variables predictoras colesterol, ndice de masa corporal y edad
Variable

Coeficiente

EE

IC95%

Constante

10,55

9,13

-7,70 a 28,81

1,15

0,252

Colesterol

0,17

0,03

0,1 0,24

4,84

< 0,001

IMC

0,68

0,30

0,09 1,28

2,31

0,024

Edad

0,24

0,14

- 0,05 a 0,53

1,67

0,100

Suma de
cuadrados

g.l

Media
Cuadrtica

Regresin

4622,52

1540,84

24,87

< 0,001

Residual

3903,60

63

61,96

Total

8526,12

66

edad
EE edad

0,24
0,14

= 1,71

< Z95% (1,96)

p = 0,100

Prtegas Daz S, Pita Fernndez S. Tcnicas de regresin: Regresin lineal mltiple. Cad Aten Primaria
2000; 7: 173-176.

C aptulo 12

Mtodo de introduccin de las


variables

REGRESIN LINEAL
MLTIPLE

REGRESIN LOGSTICA
MULTIVARIANTE

Forward (hacia adelante)

Introducir progresivamente en el modelo las variables


predictoras estadsticamente significativas, comenzando por
la que tenga mayor significacin

Backward (hacia atrs)

Comienza por estimar un modelo que contiene todas las


variables predictoras para ir eliminando posteriormente
una a una, de forma sucesiva, aquellas que no sean
significativas

Stepwise

Es una combinacin de los anteriores

Pgina 1322

C aptulo 12

Pgina 1323

Anlisis multivariante
Anlisis multivariante para la deteccin de potenciales factores de
confusin
Variable Predictora 1
Variable Predictora 2
Variable Predictora 3
Variable Predictora 4
Variable Predictora 5
Variable Predictora n

Variable Resultado

C aptulo 12

Sesgo de confusin

Variable resultado Enfermedad o


efecto E

Variable predictora Exposicin F


o factor de riesgo

Variable
confundente

Es el nico sesgo que se puede controlar (evitar) en la fase de anlisis y no slo en la fase de diseo.
Distorsin en las conclusiones del estudio, producida por la distribucin desigual, en los grupos de
comparacin, de una tercera variable (confundente C).

Pgina 1324

C aptulo 12

Pgina 1325

Portadores del Alelo 4

- Elevada prevalencia de enfermedad coronaria


- Mayor extensin de la arteriosclerosis
- Mayor tasa de IAM
- Mayor mortalidad de causa coronaria
Alelo 4

Enfermedad coronaria

- ANLISIS UNIVARIANTE:
El 15,7% de los portadores del alelo 4 presentaban CI frente al 6,9% en NO
4 (p<0,01)
ORc = 2,49 IC95%: 1,19-5,22

C aptulo 12

Modelo de regresin logstica


Exposicin
Alelo 4

Potenciales FACTORES DE CONFUSIN


- Edad
- Sexo
- HTA
- Tabaquismo
- Obesidad (IMC)
- Lpidos y lipoprotenas

Enfermedad coronaria

Pgina 1326

C aptulo 12

Pgina 1327

Regresin logstica multivariante para la deteccin de


potenciales factores de confusin
Enfermedad coronaria

Alelo 4

No corregido
Corregido para la edad y el sexo

2,49 (1,19 - 5,22)

Corregido para la edad, el sexo y otros


factores de riesgo cardiovascular (FRCV)

2,59 (1,15 - 5,83)

Corregido para la edad, el sexo, otros


factores de FRCV y perfil lipdico

0,75

OR (IC95%)

2,83 (1,18 - 6,81)


2,56 (1,03 - 6,39)

Asociacin entre la prevalencia de enfermedad coronaria y el tipo de apo E (4 frente a no 4) expresada


como OR e IC95% en una poblacin de 386 pacientes con hipercolesterolemia. Se presenta la asociacin
simple (anlisis univariante) (OR no corregido) y despus de corregir, de forma escalonada, para distintas
variables predictoras potencialmente confundentes como la edad y el sexo, para estas variables ms la
presencia de hipertensin arterial, tabaquismo e IMC y, por ltimo, todos los anteriores ms el perfil lipdico
colesterol total, cHDL y triglicridos mediante anlisis multivariante.

C aptulo 12

Pgina 1328

Reflexiones finales

Los distintos tipo de sesgos, la influencia del azar y la presencia de variables


predictoras de CONFUSIN deben finalmente siempre, tenerse en cuenta,
en todos los estudios como explicacin posible de cualquier asociacin
estadstica ya sea esta positiva, negativa o no existente.
Y como sealaba M. Susser en sus reflexiones sobre causalidad
Cuando hay minas por todas partes uno no debe aventurarse sin un detector
de minas (ANLISIS MULTIVARIANTE).

Susser M. Conceptos y estrategias en epidemiologa. El pensamiento causal en ciencias de la salud.


Mxico: Biblioteca de la Salud; 1991.

C aptulo 12

REGRESIN LINEAL
MLTIPLE

REGRESIN LOGSTICA
MULTIVARIANTE

Variable
RESULTADO

Cuantitativa

Cualitativa
(dicotmica)

Variables
PREDICTORAS

Cualitativa
Cuantitativa

Cualitativa
Cuantitativa

ECUACIN

Y = 0 + 1X1 + ... + nXn

Pgina 1329

C aptulo 12

Modelo de regresin mltiple de Cox


REGRESIN
MLTIPLE de COX
Variable
RESULTADO

Cuantitativa
Desenlace: supervivencia a tiempo t

Variables
PREDICTORAS

Cualitativa
Cuantitativa
(factores pronstico)

ECUACIN

Pgina 1330

C aptulo 12

Anlisis multivariante

Edad
Estado civil
Tiempo de alcoholismo
Bilirrubina
Presencia de ascitis
Albmina

Probabilidad de muerte

Pgina 1331

C aptulo 12

Estudio de cohortes prospectivo de pacientes alcohlicos


Variables predictoras

Anlisis Univariante (p)

Edad

p < 0,05

Estado civil

p < 0,05

Tiempo de alcoholismo

p < 0,05

Bilirrubina srica

p < 0,05

Presencia de ascitis

p < 0,05

Albmina srica

p < 0,05

Pgina 1332

C aptulo 12

Estudio de cohortes prospectivo de pacientes alcohlicos


Factores de Riesgo

Muertos por otras


causas

162 pacientes
alcohlicos
hospitalizados

Fallecimientos 56

Sobrevivientes 59
Prdidas de
seguimiento
Seguimiento mediana 8,7 aos

Pgina 1333

C aptulo 12

Estudio de cohortes prospectivo de pacientes alcohlicos

Edad

Ascitis

Pacientes
alcohlicos

Muerte

Bilirrubina

Estado civil

Pgina 1334

C aptulo 12

Estudio de cohortes prospectivo de pacientes alcohlicos

Variables predictoras con significado pronstico en pacientes alcohlicos


Modelo de Regresin de Cox (mtodo paso a paso)
Variable

RR

IC95% del RR

Significacin

Edad

1,0763

1,0334-1,1209

0,0004

Ascitis

2,0940

1,0553-4,1551

0,0345

Bilirrubina

1,4220

1,2058-1,6769

0,0000

Estado civil

2,3922

1,1796-4,8515

0,0156

Pgina 1335

C aptulo 12

Pgina 1336

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable
Independiente o
PREDICTORA

Variable
Dependiente o
RESULTADO

Pruebas de contraste de
hiptesis

Observaciones y/o limitaciones del test

Cualitativa

Cualitativa

Ji cuadrado
Prueba exacta de Fisher
Test de McNemar
Q de Cochran
REGRESIN LOGSTICA

Si el tamao muestral es grande


Si el tamao muestral es pequeo
Dos grupos de muestras repetidas o apareadas
Ms de dos grupos de muestras repetidas o apareadas
Varias variables predictoras cualitativas

Cualitativa

Cuantitativa

t de Student
Anlisis de la Varianza
Test de Mann-Whitney
Test de Wilcoxon
Test de Kruskall-Wallis
Test de Friedman

Compara medias entre dos grupos independientes


Compara medias entre ms de dos grupos independientes
Dos grupos independientes No paramtricos
Dos grupos medidas repetidas No paramtrico
Ms de dos grupos No paramtrico, medidas repetidas
Ms de dos grupos No paramtrico medidas repetidas

Cuantitativa

Cualitativa

Regresin logstica simple


Regresin logstica multivariante

Una sola variable predictora cuantitativa


Varias variable predictoras cuantitativa o cualitativas

Cuantitativa

Cuantitativa

Regresin lineal simple


Correlacin de Pearson
Correlacin de Sperman
REGRESIN MLTIPLE

Paramtrico
Paramtrico
No paramtrico
Varias variables predictoras cuantitativas

Cualitativa

Superviviencia

Kaplan-Meier
Long-Rank
Regresin de COX

Curvas de superviviencia
Compara curvas de superviviencia
Anlisis Multivariante

C aptulo 13

Captulo 13
Publicacin Bioestadstica: Bibliografa.

Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Pgina 1337

C aptulo 13

Pgina 1338

Bibliografa utilizada en el curso (1)


- Alvarez Cceres R. Estadstica aplicada a las ciencias de la salud. Madrid. Daz de
Santos 2007.
- Martnez-Gonzlez MA, editor. Bioestadstica amigable. 2 ed. Madrid : Daz de
Santos, 2006.
- Martn Andrs A, Luna del Castillo JD. Bioestadstica para las ciencias de la salud. 4
ed. Madrid: NORMA; 1993.
- Milton JS, Tsokos JO. Estadstica para biologa y ciencias de la salud. Madrid:
Interamericana McGraw Hill; 2001.
- Dawson-Saunders B, Trapp RG. Bioestadstica Mdica. 2 ed. Mxico: Editorial el
Manual Moderno;1996.
- Pita Fernndez, S. Uso de la estadstica y la epidemiologa en atencin primaria. En:
Gil VF, Merino J, Orozco D, Quirce F. Manual de metodologa de trabajo en atencin
primaria. Universidad de Alicante. Madrid, Jarpyo Editores, S.A. 1997; 115-161.

C aptulo 13

Pgina 1339

Bibliografa utilizada en el curso (2)


- Castillo Ron E. Introduccin a la estadstica aplicada. Santander: Ed. autor; 1993.
- Cobo E, Muoz P, Gonzlez JA. Bioestadstica para no estadsticos: bases para
interpretar artculos cientficos. msterdam : Elsevier Masson, 2007.
- Morell Ocaa M, Redondo Bautista M. Metodologa cientfica en ciencias de la salud.
Grupo editorial 33 (Mlaga); 2002.
- Argimn Palls JM, Jimnez Villa J. Mtodos de investigacin aplicados a la atencin
primaria de salud. 2 ed. Barcelona: Mosby-Doyma; 1994.
- Sackett DL, Richarson WS, Rosenberg W, Hynes RB. Evidence-based medicine: how
to practice and teach EBM. 2nd ed. London: Churchill-livingstone; 2000.
- Silva Ayaguer LC. Cultura estadstica e investigacin cientfica en el campo de la
salud: una mirada crtica. Madrid: Ediciones Daz de Santos; 1997.

C aptulo 13

Pgina 1340

Bibliografa utilizada en el curso (3)


- Bailar JC III. Some uses of statistical thinking. En: Bailar JC III, Mostoller F, editors.
Medical uses of statistics. Boston: N Engl J Med Books, 1992; p. 25-57
- Bobenrieth Astete M.A . Mitos y realidades en torno a la publicacin cientfica. Med
Clin (Barc) 2000; 114: 339-341.
- Bobenrieth Astete M.A . Lectura crtica de artculos originales en Salud. Medicina de
Familia (And) 2001; 2: 81-90.
- Antoja Rib F. The innocence of the storks. Rev Lab Clin 2010; 3 (2): 51.
- Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ
1995;311:485.
- Argimon JM. La ausencia de significacin estadstica en un ensayoclnico no significa
equivalencia teraputica. Med Clin (Barc) 2002; 118: 701-3
- Mora I, Ripoll R. Cmo mejorar la calidad estadstica de los artculos presentados
a revistas biomdicas: lista de comprobacin para los autores. Med Clin (Barc).
1999;113:138-49.

C aptulo 13

Pgina 1341

Bibliografa utilizada en el curso (4)


- Salsburg DS. The religion of statistics as practiced in medical journals. Am Statistician
1985; 39: 220-223.
- Pocock SJ. The role of statistics in medical research. Br J Psychiat 1980; 137: 188-190.
- Chia KS. Significant-itis: an obsession with the P value. Scand J Work Environ Health.
1997; 23:152-4.
- Christenson P. To p or not to p. J Child Adolesc Psychiatr Nurs. 1995; 8:42.
- Neyman J, Pearson E. On the problem of the most efficient tests of statistical
hypothesis. Philosophical trans of the Royal Society of London (A) 1933;231:289-337.
- Ars A. Tmese una antes de acostarse. 1 edicin. Barcelona: Planeta; 1998.

C aptulo 13

Pgina 1342

Bibliografa utilizada en el curso (5)


- Martn Andrs A. Bioestadstica para ciencias de la salud. 1 ed. Madrid : Ediciones
Norma-Capitel, 2004.
- Prez Lpez C. Mtodos estadsticos avanzados con SPSS. Thomson, 2005.
- Garca A. Mtodos avanzados de estadstica aplicada. Madrid: UNED, 2001.
- Juez Martel P, Diez Vegas FJ. Probabilidad y Estadstica en Medicina. Madrid: Daz de
Santos, 1997.
- Alvarez Cceres R. Estadstica multivariante y no paramtrica con SPSS. Madrid: Daz
de Santos, 1994.
- Armitage P, Berry G. Estadstica para la Investigacin Biomdica. Doyma, Barcelona,
1992.
- DL Sackett. Epidemiologa clnica. Buenos Aires, Editorial Mdica Panamericana,
1994.

C aptulo 13

Pgina 1343

Bibliografa utilizada en el curso (6)


- Pita Fernndez S, Prtega Daz S. Significancia estadstica y relevancia clnica. Cad
Aten Primaria 2001; 8: 191-195.
- Escrig Sos J et al. Intervalos de confianza: por qu usarlos. Cir Esp. 2007;81(3):121-5.
- Camps Garca MT, Muoz Rocan N, Calvo de Mora A, De Ramn Garrido E. Los
cocientes de probabilidad como medida de la utilidad de la determinacin de anticuerpos
antinucleares por inmunofluorescencia indirecta en la clnica. Aplicacin de los
resultados de la investigacin clnica. Med Clin (Barc)1999;113: 476.
- Tibblea J et al. Faecal calprotectin and faecal occult blood tests in the diagnosis of
colorectal carcinoma and adenoma. Gut 2001;49:402-408.

C aptulo 13

Pgina 1344

Bibliografa utilizada en el curso (7)


- Seoanea T et al. Estadstica: Estadstica Descriptiva y Estadstica Inferencial.
SEMERGEN. 2007;33(9):466-71.
- Iraurgi I. Significancia estadstica y relevancia clnica. Norte de Salud Mental 2009;
94 - 108.
- Rubio C. Diseo estadstico de ensayos clnicos. Med Clin (Barc) 1996; 107: 303-309.
- Plasencia A, Porta Serra M. La calidad de la informacin clnica (II): significacin
estadstica. Med Clin (Barc) 1988; 90: 122-126.
- Carlos Manterola D, Viviana Pineda N. El valor de p y la significacin estadstica.
Aspectos generales y su valor en la prctica clnica. Interpretation of medical statistics.
Rev. Chilena de Ciruga 2008; 60: 86-89.

C aptulo 13

Pgina 1345

Bibliografa utilizada en el curso (8)


- Lpez de Ullibarri Galparsoro I, Pita Fernndez S. Medidas de concordancia: el ndice
Kappa. Cad Aten Primaria 1999; 6: 169-171.
- Pita Fernndez S, Prtegas Daz S. Relacin entre variables cuantitativas. Cad Aten
Primaria 1997; 4: 141-144.
- Pita Fernndez S, Prtegas Daz S. Pruebas diagnsticas. Cad Aten Primaria 2003;
10: 120-124.
- Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis
de concordancia para variables numricas. Cad Aten Primaria 2004.
- Prtegas Daz S, Pita Fernndez S. Tcnicas de regresin: Regresin lineal mltiple.
Cad Aten Primaria 2000; 7: 173-176.

C aptulo 13

Pgina 1346

Bibliografa utilizada en el curso (9)


- Pita Fernndez S, Prtegas Daz S. Tcnicas de regresin: regresin lineal mltiple.
Cad Aten Primaria 2000; 7: 91-94.
- Pita Fernndez S. Correlacin frente a causalidad JANO 1996; (1174): 59-60.
- Pita Fernndez S. Determinacin del tamao muestral. Cad Aten Primaria 1996; 3:
138-144.
- Prtegas Daz S , Pita Fernndez S. La distribucin normal. Cad Aten Primaria 2001; 8:
268-274.
- Prtegas Daz S , Pita Fernndez S. Mtodos paramtricos para la comparacin de
dos medias. t de Student. Cad Aten Primaria 2001; 8: 37-41.
- Passing H, Bablok W. A new biometrical procedure for testing the equality of
measurements from two different analytical methods. J Clin Chem Biochem 1983; 21:
709-20.

C aptulo 13

Bibliografa utilizada en el curso (10)


- Burgueo MJ, Garca-Bastos JL y Gonzlez-Buitrago JM. Las curvas ROC en la
evaluacin de las pruebas diagnsticas. Med Clin (Barc) 1995: 104: 661-670.
- Hanley JA, McNeil BJ. The meaning and use of the area under aReceiver Operating
Characteristic (ROC) Curve. Radiology 1982; 143: 29-36.
- Lpez de Ullibarri Galparsoro I, Pita Fernndez S. Curvas ROC. Cad Aten Primaria
1998; 5: 229-235.
- McNeil BJ, Keeler E, Adelstein SJ. Primer on certain elements of medical decision
making. N Engl J Med 1975; 293: 211-215.
- Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of
medical diagnoses. Nueva York: J Wiley and Sons, lnc., 1975.

Pgina 1347

C aptulo 13

Pgina 1348

Bibliografa utilizada en el curso (11)


- Beck JR, Shultz EK. The use of relative operating characteristic (ROC) curves in test
performance evaluation. Arch Pathol Lab Med 1986; 110:13-20.
- Swets JA. Measuring the accuracy of diagnostic systems. Science 1988; 240: 1.2851.293.
- Zweig MH, Campbell G. Receiver-operating characteristic (ROC) plots: a fundamental
evaluation tool in clinical medicine. Clin Chem 1993; 39: 561-577.
- Yupanqui Pacheco RM: Introduccin a la estadstica bayesiana. UNMSM. Facultad
de Ciencias Matemticas. EAP de Estadstica, Lima, 2005 (disponible en: http://sisbib.
unmsm.edu.pe/ bibvirtualdata/Tesis/Basic/yupanqui_pr/yupanqui_pr.pdf).
- Altman DG, Moher D. Elaboracin de directrices para la publicacin de investigacin
biomdica: proceso y fundamento cientfico. Med Clin (Barc). 2005;125(Supl 1):8-13.

C aptulo 13

Pgina 1349

Bibliografa utilizada en el curso (12)


- Lpez, F. Utilizacin adecuada de las pruebas estadsticas en los estudios de
comparacin de procedimientos. Quim Clin 2000; 19: 237.
- Fleiss JL. The design and analysis of clinical experiments. Nueva York: John Wiley &
Sons, Inc., 1986.
- Luis Prieto, Rosa Lamarca, Alfonso Casado. La evaluacin de la fiabilidad en las
observaciones clnicas: el coeficiente de correlacin intraclase. Med Clin (Barc).
1998;110:142-5.
- (*) Wakkers PJM, Hallendoorn HBA, Op de Weegh GJ, Heerspink W. Applications of
statistics in clinical chemistry. A critical evaluation of regression lines. Clin Chim Acta
1975; 64: 173-84.
- Cornbleet PJ, Gochman N. Incorrect least-squares regression coefficients in methodcomparison analysis. Clin Chem 1979; 25: 432-38.
- Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended linear regressin
models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.

C aptulo 13

Pgina 1350

Bibliografa utilizada en el curso (13)


- Frey E, Fuentes-Arderiu X, Queralt JM. Comparacin estadstica de mtodos
analticos. Educacin continuada Qumica Clnica. 1988; 1: 69-79.
- Lpez, F. Utilizacin adecuada de las pruebas estadsticas en los estudios de
comparacin de procedimientos. Quim Clin 2000; 19: 237.
- Westgard JO, Hunt MR. Use and interpretation of common statistical test in methodcomparison studies. Clin Chem 1973; 19: 44-57.
- Bland JM, Altman DG. Statistical methods for assesing agreement between two
methods of clinical measurement. Lancet 1986; 1: 307-310.
- Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis
de concordancia para variables numricas. Cad Aten Primaria 2004.

C aptulo 13

Pgina 1351

Bibliografa utilizada en el curso (14)


- Altman DG, Bland JM. Statistical methods for assessing agreement between two
methods of clinical measurement. The lancet 1986; 307-10.
- Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison
studies. The Statistician 1983; 32, 307-317.
- Lpez, F. Utilizacin adecuada de las pruebas estadsticas en los estudios de
comparacin de procedimientos. Quim Clin 2000; 19: 237.
- Prtegas Daz S , Pita Fernndez S. Determinacin del tamao muestral para calcular
la significacin del coeficiente de correlacin lineal. Cad Aten Primaria 2001; 9: 209-211.
- Jacobo Daz Portillo .Influencia del grupo tnico en el patrn lipoproteico de una
determinada poblacin peditrica de Ceuta, Tesis doctoral (1997). Facultad de Medicina
de la Universidad de Cdiz.

C aptulo 13

Pgina 1352

Bibliografa utilizada en el curso (15)


- Albert A, Harris EK. Multivariate interpretation of clinical laboratory data. New York:
Marcel Dekker; 1987.
- Saez M. El problema de las medidas repetidas. Anlisis longitudinal en epidemiologa.
Gac Sanit 2001;15(4):347-352.
- F. Lpez Azorn. La necesidad de mejores evaluaciones metodolgicas y nuestra
exigencia ante los criterios de aceptabilidad de los resultados. Qumica Clnica 2003; 22
(6) 431-432.
- Snchez-Cantalejo Ramrez E. Regresin logstica en salud pblica. EASP 2000.
- Silva Ayaguer LC. Excursin a la regresin logstica en ciencias de la salud. Madrid:
Daz de Santos, 1995.
- Hernndez Aguado I, Porta Serra M, Miralles M, Garca Benavides F, Bolmar F. La
cuantificacin de la variabilidad en las observaciones clnicas. Med Clin (Barc) 1990; 95:
424- 429.

C aptulo 13

Pgina 1353

Bibliografa utilizada en el curso (16)


- Prtegas Daz S, Pita Fernndez S. Representacin grfica en el anlisis de datos.
Cad Aten Primaria 2001; 8: 112-117.
- Lpez de Ullibarri Galparsoro I, Pita Fernndez S. Medidas de concordancia: el ndice
Kappa. Cad Aten Primaria 1999; 6: 169-171.
- Prieto L, Lamarca R, Casado A. La evaluacin de la fiabilidad en las observaciones
clnicas: el coeficiente de correlacin intraclase. Med Clin 1998: 110(4): 142-145.
- Argimon JM. El intervalo de confianza: algo ms que un valor de significacin
estadstica. Med Clin (Barc) 2002;118(10):382-4.
- Argimon JM. La ausencia de significacin estadstica en un ensayo clnico no significa
equivalencia teraputica. Med Clin (Barc) 2002;118(18):701-3.
- Ramalle-Gmara E, Andrs de Llano JM. Utilizacin de mtodos robustos en la
estadstica inferencial. Aten Primaria 2003;32(3):177-82.
- Cobo E. Anlisis multivariante en investigacin biomdica: criterios para la inclusin de
variables. Med Clin (Barc) 2002;119(6):230-237.

Gua Prctica del Curso


de Bioestadstica Aplicada
a las Ciencias de la Salud
Dr. Jacobo Daz Portillo

Coordinador de Formacin Continuada


Hospital Universitario de Ceuta

Edita: Instituto Nacional de Gestin Sanitaria


Subdireccin General de Gestin Econmica y Recursos Humanos
Servicio de Recursos Documentales y Apoyo Institucional
Alcal, 56 28014 Madrid
El copyright y otros derechos de propiedad intelectual pertenecen
al Instituto Nacional de Gestin Sanitaria.
Se autoriza la reproduccin total o parcial para uso no comercial,
siempre que se cite explcitamente su procedencia.
Depsito Legal: M-33564-2011
NIPO: 865-11-010-6
Coleccin Editorial de Publicaciones del INGESA: 1.921

Gua Prctica del Curso


de Bioestadstica Aplicada
a las Ciencias de la Salud

Dr. Jacobo Daz Portillo

También podría gustarte