Bio Estadistica

Material docente de la Unidad de Bioestadstica Clnica
1. Teora de la probabilidad
2. Introduccin a la estadstica
3. Anlisis de la varianza
4. Modelos de regresin lineal
5. Precisin y validez de las pruebas diagnsticas
6. Modelos de regresin logstica
7. Modelos de regresin de Poisson
8. Anlisis de Supervivencia
9. Medidas de frecuencia de la enfermedad
1. Teora de la probabilidad
1.1 Idea intuitiva
1.2 Formalizacin de la probabilidad
1.3 Definicin axiomtica de la probabilidad
1.4 Propiedades de la probabilidad
1.5 Probabilidad condicionada
1.6 Sucesos independientes
1.7 Regla de la probabilidad total
1.8 Teorema de Bayes
1.9 Problemas propuestos
Anexo I
Repaso de Algebra de Conjuntos
Definiciones
Propiedades
Funcin de conjunto
2 Estadstica
2.1 Definiciones
2.1.1 Por qu la estadstica?
2.2 Estadstica descriptiva
2.2.1 Mtodos grficos de representacin de datos
2.2.2 Medidas descriptivas
2.2.3.Medidas de posicin
2.2.4 Medidas de dispersin
2.3 Variable aleatoria
2.3.1 Induccin de probabilidad a variables aleatorias
2.3.2 Funcin densidad de probabilidad (fdp)
2.3.3 Funcin acumulativa de probabilidad
http://www.hrc.es/bioest/M_docente.html (1 of 5) [28/12/2002 18:09:39]
2.3.4 Parmetros caractersticos de una fdp

2.5 Inferencia estadstica
2.6 Estimacin de parmetros
2.6.1 Distribucin muestral de medias
2.6.2 Estimacin de proporciones
2.8 Contrastes de hiptesis
2.8.1 Tamao muestral para contrastes sobre medias
2.8.2 Comparacin de medias
2.8.3 Independencia de v.a. cualitativas
2.9 Estadsticos de fuerza de asociacin
2.11 Introduccin a la causalidad
2.12 Introduccin al anlisis multivariante
3. Anlisis de la varianza
3.1 Bases del anlisis de la varianza
3.2 Algunas propiedades
3.3 Ejemplo 1
3.4 Pruebas para la homocedasticidad
3.5 Modelos de Anova
3.5.1 Modelo I o de efectos fijos
3.5.2 Modelo II o de efectos aleatorios
3.6 Pruebas a posteriori
3.7 Anlisis de la varianza de dos factores
3.8 Identidad de la suma de cuadrados
3.9 Contrastes de hiptesis en el anova de 2 vas
3.9.1 Modelo I
3.9.2 Modelo II
3.9.3 Modelo mixto
3.10 Ejemplo 2
3.11 Tamaos muestrales desiguales en un anova de 2 vas
3.12 Casos particulares: Anova sin repeticin y Bloques completos aleatorios
3.13 Ejemplo 3
3.14 Anlisis de la varianza de ms de dos factores
4. Correlacin y Modelos de regresin lineal
4.1 Bibliografa
4.2 Generalizacin del concepto de fdp a variables multidimensionales
4.3 Independencia de dos variables aleatorias
4.4 Funcin lineal
4.5 Modelo I de regresin lineal simple
4.6 Interpretacin del contraste 1=0

4.7 Inferencias sobre la regresin
4.8 Anlisis de la varianza de la regresin simple
4.9 Modelo II de regresin lineal simple
4.10 Propiedades del coeficiente de correlacin
4.11 Potencia de los contrastes en regresin
4.12 Modelo de regresin lineal mltiple
4.13 Estimacin y contrastes de hiptesis
4.14 Anlisis de la varianza de la regresin mltiple
4.15 Variables indicadoras ("dummy")
4.16 Interaccin y confusin en la regresin
4.17 Estrategias de modelizacin
4.18 El problema de la colinealidad
4.19 Anlisis de los residuos
4.20 Regresin lineal con el PRESTA
5. Errores en las mediciones y clasificaciones clnicas: Precisin y validez
5.1 ndices de concordancia
5.2 Problemas del ndice kappa
5.3 Clasificaciones multinomiales
5.4 ndice kappa con "pesos"
5.5 Distribucin muestral del ndice kappa
5.6 Clculo del ndice kappa con el PRESTA
5.7 Concordancia para variables continuas
5.8 ndices de validez
5.9 Cocientes de probabilidad (CP)
5.10 Intervalos de confianza para los CP's
5.11 Tablas Kx2
5.12 Ms de dos enfermedades
5.13 Clculo de estos ndices con el PRESTA
5.14 Curvas ROC
5.15 Eleccin del punto de corte ptimo
5.16 Sesgos en la evaluacin de las pruebas diagnsticas
6. Modelos de regresin logstica
6.1 Bibliografa
6.2 Asociacin entre variables binomiales
6.3 Modelo de regresin logstica simple
6.4 Estimacin de los coeficientes
6.5 Distribucin muestral de los coeficientes
6.6 Estimacin por intervalos y contrastes de hiptesis sobre los coeficientes
6.7 Modelo mltiple
6.8 Prueba de Hosmer-Lemeshow
6.9 rea bajo la curva ROC

6.10 Variables indicadoras ("dummy")
6.11 Interaccin y confusin en regresin logstica
6.13 La colinealidad en regresin logstica
6.14 Regresin logstica condicional
6.15 Evaluacin de los modelos de regresin logstica
7. Modelos de regresin de Poisson
7.1 Bibliografa
7.2 Variables de Poisson
7.3 Modelo de regresin de Poisson
7.4 Estimacin de los coeficientes
7.5 Distribucin muestral de los estimadores
7.6 Contrastes de hiptesis y estrategias de modelizacin
7.7 La colinealidad en regresin de Poisson
7.8 Relacin entre los modelos de Poisson y logstico
8. Anlisis de Supervivencia
8.1 Bibliografa
8.2 Introduccin
8.3 Distribucin de la variable tiempo de espera
8.4 Estimacin de la funcin de supervivencia (mtodo de Kaplan-Meier)
8.5 Varianza de los estimadores
8.6 Mtodo actuarial
8.7 Comparacin de funciones de supervivencia
8.8 Alternativa parmetrica
8.8.1 Funcin exponencial
8.8.2 Funcin de Weibull
8.8.3 Funcin lognormal
8.8.4 Funcin gamma
8.9 Modelo de riesgo proporcional (Cox)
8.10 Estimacin de los coeficientes y contrastes de hiptesis
9. Medidas de frecuencia de la enfermedad
9.1 Bibliografa
9.2 Introduccin
9.3 Prevalencia
9.4 Incidencia
9.4.1 Incidencia acumulada
9.4.2 Densidad de incidencia
9.5 Intervalos de confianza
9.6 Medidas de asociacin o efecto

9.6.1 Razn de tasas de incidencia
9.6.2 Riesgo relativo
9.6.3 Odds ratio
9.6.4 Diferencia absoluta de riesgo
9.6.5 Reduccin absoluta de riesgo
9.6.6 Diferencia relativa de riesgo
9.6.7 Reduccin relativa de riesgo
9.6.8 Nmero necesario a tratar
9.7 Comparacin de las distintas medidas
9.8 Intervalos de confianza
TEORIA de la PROBABILIDAD
PROBABILIDAD
V.Abraira
Referencia bibliogrfica
A.Prez de Vargas, V.Abraira. Bioestadstica. Centro de Estudios Ramn Areces. Madrid. 1996.
Idea intuitiva
Nmero, entre 0 y 1, asociado con la verosimilitud de que ocurra un suceso, 0 cuando estamos seguros que el
suceso no va a ocurrir y 1 cuando estamos seguros que s va a ocurrir. El problema es cmo asignar ese nmero
en situaciones de incertidumbre?
a) A veces se estima por la frecuencia relativa. P.e. una manera de aproximarnos a la probabilidad de que una
intervencin quirrgica arriesgada tenga xito es consultar el registro de las intervenciones quirrgicas realizadas
sobre pacientes similares, si de las ltimas 10, ha sido un xito en 8, la frecuencia relativa es 8/10=0,8 se parecer
a esa probabilidad.
La frecuencia relativa cambia, en el ejemplo anterior si el registro, en lugar de 10 pacientes, tuviera 11, la
frecuencia relativa sera necesariamente distinta (8/11 9/11), pero hay una ley emprica que establece que
cuando el "nmero de ensayos" (pacientes, en el ejemplo) es suficientemente grande, la frecuencia relativa se
estabiliza. A veces, se define la probabilidad como el lmite de la frecuencia relativa. Cmo saber, en cada caso,
si el "nmero de ensayos" es suficientemente grande? Una parte de la estadstica tiene que ver con este
problema.
La grfica muestra la evolucin de la
frecuencia relativa del resultado "cara
1" en 4 series de 100 tiradas de un
dado.
Se observa que la frecuencia relativa
oscila, que la amplitud de las
oscilaciones va decreciendo a medida
que aumenta el nmero de tiradas y
que todas las series tienden a
estabilizarse a la misma altura,
tambin que 100 no es un nmero
"suficientemente grande" para que la
frecuencia relativa ya est
estabilizada (los valores finales de las
4 series varan entre 0,17 y 0,21).
b) Hay situaciones en que se puede calcular: si todos los resultados del experimento son igualmente probables,
entonces la probabilidad se define (definicin clsica o de Laplace) como el cociente entre el nmero de casos
favorables y el nmero de casos totales.
La probabilidad de que el resultado de tirar un dado sea un uno, se calculara de esta forma. Comprese el
resultado 1/6 obtenido as con la grfica anterior.
http://www.hrc.es/bioest/Probabilidad_1.html [28/12/2002 18:09:56]
Formalizacin de la probabilidad
Formalizacin de la probabilidad
Convenios: Los textos en color malva corresponden a un mayor nivel de formalizacin y
pueden ser omitidos en una primera lectura.
Experimento Aleatorio: experimento que puede ser repetido bajo "las mismas condiciones", del
que puede establecerse el conjunto de sus posibles resultados, pero no predecir un resultado
concreto.
Espacio muestral: conjunto de posibles resultados.
Punto muestral: elemento del espacio muestral.
Suceso: cualquier subconjunto del espacio muestral.
Si representamos el espacio muestral por y a los sucesos por A: A . Dado que el
conjunto vaco es subconjunto de cualquier conjunto ( ) y que todo conjunto es
subconjunto de s mismo ( ), tanto el conjunto vaco como el espacio muestral son
sucesos.
Si lo necesita Repaso del lgebra de conjuntos
Un problema a tener en cuenta es que dado un experimento, podemos encontrar ms de
un espacio muestral.
Ejemplo 1: una mujer portadora de hemofilia tiene 3 hijos Cul es el espacio muestral
apropiado para estudiar la posible hemofilia de estos?
Opcin a: Cada hijo puede padecer hemofilia (s) o no (n), por tanto
1={sss, ssn, sns, nss, snn, nsn, nns, nnn}
Donde, por ejemplo, 'sns' significa el primero y el tercero la padecen y el segundo no. Hay que
asegurarse que no se olvida ninguno.
En este espacio muestral, el suceso "dos hijos padecen hemofilia" se representa como
A1={ssn, sns, nss} y el suceso "los dos primeros no la padecen" como A2={nns, nnn}
Opcin b: Pueden padecer hemofilia los tres hijos (3), dos (2), ...
2={3, 2, 1, 0}
En este espacio muestral, el suceso "dos hijos padecen hemofilia" es A1={2} y el suceso "los
dos primeros no la padecen" no se puede representar porque en el espacio muestral no est
contemplado el orden.
Definicin axiomtica de probabilidad
Definicin axiomtica de probabilidad

Convenios: Los textos en color malva corresponden a un mayor nivel de formalizacin
Sea : espacio muestral, P() conjunto de las partes de , o conjunto de sucesos, o lgebra
de sucesos. Se define probabilidad, o funcin de probabilidad, a cualquier funcin p: P()
(es decir, una regla bien definida por la que se asigna a cada suceso un, y un solo un, nmero
real) que cumpla los axiomas siguientes
i) p(A) 0 A P()
ii) p(A1 A2 A3 ...) = p(A1) + p(A2) + p(A3) + ...
si Ai Aj = i j (sucesos mutuamente excluyentes)
iii) p() = 1
A la estructura (, P(), p) se le denomina espacio de probabilidad.
Establecer claramente el espacio de probabilidad ser el primer paso imprescindible para
estudiar una experiencia aleatoria. Muchas de las dificultades que surgen, en la prctica, en el
anlisis estadstico de investigaciones clnicas tienen que ver con el establecimiento implcito y
defectuoso de este espacio.
Obsrvese que es necesario asignar un nmero a todos los sucesos, no slo a los sucesos
elementales, pero si se ha asignado la probabilidad a los sucesos elementales, a travs de la
propiedad ii) se puede asignar a todos los dems.
Ejemplo 1:
Para el experimento aleatorio de tirar un dado, el espacio muestral es = {1, 2, 3, 4, 5, 6}. En
este espacio el conjunto de sucesos es P() = {, {1}, {2}, ...{1,2}, {1,3}, ...{1,2,3,4,5,6}}. Para
establecer una probabilidad hay que asignar un nmero a todos esos sucesos.
Sin embargo si se ha asignado a los sucesos elementales p({1})= p({2})= ...= p({6})= 1/6, por la
propiedad ii), p.e. la probabilidad del suceso {1, 3} es p({1,3})= p({1})+ p({3})=2/6.
Nota: El suceso {1} es: "el resultado de tirar el dado es la cara 1", el suceso {1, 3} es: "el
resultado de tirar el dado es la cara 1, o la 3", el suceso {1, 3, 5} es: "el resultado de tirar el
dado es una cara impar".
Propiedades de la probabilidad
Propiedades de la probabilidad
Demostraciones
1) p(Ac) = 1 - p(A)
Ac representa el suceso complementario de A, es decir el formado por todos los resultados que
no estn en A.
2) A1 A2 p(A1) p(A2)
3) p() = 0
4) p(A) 1
5) p(A B) = p(A) + p(B) - p(A B) (Regla general de la adiccin)
Ejemplo 2: Un 15% de los pacientes atendidos en un hospital son hipertensos, un 10% son
obesos y un 3% son hipertensos y obesos. Qu probabilidad hay de que elegido un paciente
al azar sea obeso o hipertenso?
A = {obeso} B = {hipertenso}
A B = {hipertenso y obeso}
A B = {obeso o hipertenso}
p(A) = 0,10; p(B) = 0,15; p(A B) = 0,03
p(A B) = 0,10 + 0,15 - 0,03 = 0,22
Probabilidad condicionada
Como la probabilidad est ligada a nuestra ignorancia sobre los resultados de la experiencia,
el hecho de que ocurra un suceso, puede cambiar la probabilidad de los dems. El proceso de
realizar la historia clnica, explorar y realizar pruebas complementarias ilustra este principio.
La probabilidad de que ocurra el suceso A si ha ocurrido el suceso B se denomina probabilidad
condicionada y se define
Esta definicin es consistente, es decir cumple los axiomas de probabilidad.

Cuando ocurre un suceso cambia el espacio muestral, por eso cambia la probabilidad. A veces
es ms fcil calcular la probabilidad condicionada teniendo en cuenta este cambio de espacio
muestral.
Ejemplo 3: Una mujer es portadora de la enfermedad de Duchenne Cul es la probabilidad
de que su prximo hijo tenga la enfermedad?
Segn las leyes de Mendel, todos los posibles genotipos de un hijo de una madre portadora
(xX) y un padre normal (XY) son xX, xY, XX, XY y tienen la misma probabilidad. El espacio
muestral es = {xX, xY, XX, XY}
el suceso A={hijo enfermo} corresponde al genotipo xY, por tanto, segn la definicin clsica
de probabilidad
p(A) = 1/4 = 0,25
La mujer tiene el hijo y es varn qu probabilidad hay de que tenga la enfermedad?
Se define el suceso B = {ser varn} = {xY, XY}
la probabilidad pedida es p(A|B) y aplicando la definicin anterior
p(B) = 0,5; A B = {xY}; p(A B) = 0,25; p(A|B) = 0,25/0,5 = 0,5
Si sabemos que es varn, el espacio muestral ha cambiado, ahora es B. Por lo tanto se puede
calcular p(A|B) aplicando la definicin clsica de probabilidad al nuevo espacio muestral
p(A|B) = 1/2 = 0,5
Ejemplo 4: Se sabe que el 50% de la poblacin fuma y que el 10% fuma y es hipertensa.
Cul es la probabilidad de que un fumador sea hipertenso?
A = {ser hipertenso} B = {ser fumador}
A B = {ser hipertenso y fumador}
p(A|B) = 0,10/0,50 = 0,20
Obsrvese que los coeficientes falso-positivo y falso-negativo de las pruebas diagnsticas son
probabilidades condicionadas.
La frmula anterior se puede poner p(A B) = p(B) p(A|B) = p(A) p(B|A)
llamada regla de la multiplicacin, que se puede generalizar a ms sucesos
p(A1 A2 A3) = p((A1 A2) A3) = p(A1 A2) p(A3|A1 A2) = p(A1) p(A2|A1) p(A3|A1
A2)
http://www.hrc.es/bioest/Probabilidad_15.html (1 of 2) [28/12/2002 18:11:13]
En general p(A1 A2 A3 ...) = p(A1) p(A2|A1) p(A3|A1 A2) ...

llamado principio de las probabilidades compuestas y especialmente til para aquellas
situaciones en que las probabilidades condicionadas son ms fciles de obtener que las
probabilidades de las intersecciones.
Ejemplo 4: Se sabe por estudios previos que el 0,1% de la poblacin tiene problemas
vasculares. Un estudio sobre individuos con problemas vasculares revela que el 20% de ellos
son placas de ateroma. Si el 10% de los individuos con placas de ateroma estn expuestos a
muerte sbita por desprendimiento de trombos qu probabilidad tiene un individuo cualquiera
de estar expuesto a muerte sbita por desprendimiento de trombos de una placa de ateroma?
A1 = {problemas vasculares}; A2 = {placas de ateroma}; A3 = {expuesto a muerte sbita por ....}
p(A1) = 0,001; p(A2|A1) = 0,20; p(A3|A1 A2) = 0,1
p(A1 A2 A3) = 0,001 x 0,20 x 0,1 = 0,000002
Ejemplo 5: Una urna contiene 10 bolas, de las cuales 3 son rojas, 5 verdes y 2 azules. Se
extraen al azar 3 bolas. Calcular la probabilidad de que la primera sea azul, y las otras dos
verdes.
Definimos A1 = {la 1 bola es azul}; A2 = {la 2 bola es verde}; A3 = {la 3 bola es verde}
p(A1) = 2/10 aplicando la definicin clsica de probabilidad, puesto que hay 10 bolas y 2 son
verdes.
p(A2|A1) = 5/9; si la primera bola extrada es azul, en la urna quedan 9 bolas, 5 de ellas verdes.
p(A3|A1 A2) = 4/8; si la primera bola extrada es azul y la segunda verde en la urna quedan 8
bolas, 4 de ellas verdes.
p(A1 A2 A3) = 2/10 x 5/9 x 4/8 = 1/18
Sucesos independientes
Sucesos independientes
Dos sucesos son independientes si y slo si p(A B) = p(A) p(B).
Si dos sucesos son independientes
y del mismo modo p(B|A) = p(B)

Esta propiedad coincide ms con la idea intuitiva de independencia y algunos textos la dan
como definicin. Hay que notar, sin embargo, que ambas definiciones no son estrictamente
equivalentes.
Ejemplo 6: Para un hijo de una mujer portadora de Duchenne, el sexo y la enfermedad son
independientes?
Segn vimos en el Ejemplo 3 el espacio muestral es = {xX, xY, XX, XY}
Definimos los sucesos A = {varn} = {xY, XY}; B = {enfermo} = {xY}
A B = {xY}
por lo tanto p(A) = 0,5; p(B) = 0,25; p(A B) = 0,25 p(A) p(B) NO son independientes.
Regla de la PROBABILIDAD total
Regla de la probabilidad total

Se llama particin a conjunto de sucesos Ai tales que
A1 A2 ... An = y Ai Aj = i j
es decir un conjunto de sucesos mutuamente excluyentes y que cubren todo el espacio
muestral
Regla de la probabilidad total: Si un conjunto de sucesos Ai forman una particin del espacio
muestral y p(Ai) 0 Ai, para cualquier otro suceso B se cumple
Demostracin
Ejemplo 7: La prevalencia de infarto cardaco para hipertensos es del 0,3% y para no
hipertensos del 0,1%. Si la prevalencia de hipertensin en una cierta poblacin es del 25%
Cul es la prevalencia del infarto en esa poblacin?
A1 = {ser hipertenso} A2 = {no serlo} estos sucesos constituyen una particin
B = {padecer infarto}
datos: p(B|A1) = 0,003; p(B|A2) = 0,001; p(A1) = 0,25
evidentemente p(A2) =0,75 por la propiedad 1
p(B) = 0,003x0,25 + 0,001 x 0,75 = 0,0015
Teorema de Bayes
Teorema de Bayes
Si los sucesos Ai son una particin y B un suceso tal que p(B) 0
Demostracin
Aplicaciones
Diagnstico mdico (en general clasificaciones no biunvocas): El diagnstico consiste en
establecer la enfermedad de un paciente, a partir de una serie de sntomas. Pero los sntomas
y las enfermedades no estn ligados de un modo biunvoco.
Llamemos Ei al conjunto de enfermedades
E1: tuberculosis pulmonar; E2 :cncer de pulmn; E3: bronquitis obstructiva; etc.
y Si a los sntomas y sndromes asociados con las mismas
S1: tos; S2: estado febril; S3: hemotisis; etc.
La informacin accesible en los libros de patologa, o en un archivo de historias clnicas es del
tipo
Para E1: algunos (digamos el 20%) tienen hemotisis; muchos (80%) tienen tos; etc.
y lo mismo para las dems enfermedades
En trminos de probabilidad condicionada, esta informacin es
p(S3|E1) = 0,2; p(S1|E1) = 0,8 etc.
para diagnosticar la tuberculosis se ha de evaluar, para los sntomas que presenta el paciente
p(E1|Si)
para lo que se puede usar el teorema de Bayes si las enfermedades forman una particin (son
mutuamente excluyentes y se consideran todas las enfermedades compatibles con el
sntoma) y se conocen sus prevalencias.
Ntese que un mismo conjunto de sntomas podra dar lugar a un diagnstico diferente en
poblaciones en las que las prevalencias fueran diferentes.
Pruebas diagnsticas: Supngase una prueba diagnstica, por ejemplo nivel de glucosa en
sangre, en ayunas, para diagnosticar la diabetes. Se considera que la prueba es positiva si se
encuentra un nivel por encima de un cierto valor, digamos 120 mg/l.
Para evaluar la prueba, (habr que hacerlo para distintos valores de corte) se somete a la
misma a una serie de individuos diabticos diagnosticados por otro procedimiento (el patrn de
oro o "gold standar") y a una serie de individuos no diabticos. Los resultados se pueden
representar en una tabla de doble entrada
Patrn de oro
NE
Prueba
Teorema de Bayes
Si la prueba fuera perfecta b=c=0, desgraciadamente nunca ocurre. Se denomina coeficiente

falso-positivo (CFP) al cociente c/t, y es una estimacin de la probabilidad condicionada
p(+|NE), se denomina coeficiente falso-negativo (CFN) al cociente b/u, y es una estimacin de
la probabilidad condicionada p(-|E). Estos dos coeficientes cuantifican los dos errores que la
prueba puede cometer y caracterizan a la misma. Simtricamente, los coeficientes que
cuantifican los aciertos son la sensibilidad, p(+|E), y la especificidad p(-|NE).
Cuando la prueba se usa con fines diagnsticos (o de "screening") interesa calcular p(E|+) y/o
p(NE|-).
como E y NE son una particin, usando el Teorema de Bayes
Ntese que ambas dependen de la prevalencia de la enfermedad: una prueba diagnstica que
funciona muy bien en la clnica Mayo, puede ser intil en el Hospital Ramn y Cajal.
Ejemplo 8: una prueba diagnstica para la diabetes tiene un CFP de 4% y un CFN del 5%. Si
la prevalencia de la diabetes en la poblacin donde se usa es del 7% cul es la probabilidad
de que sea diabtico un individuo en el que la prueba d positiva? y de que no lo sea uno en
el que d negativo?
p(+|NE) = 0,04 p(-|NE) = 0,96
p(-|E) = 0,05 p(+|E) = 0,95
p(E) = 0,07 p(NE) = 0,93
Pruebas en serie: Cuando se aplican pruebas en serie, para cada prueba p(E) y p(NE), sern
la p(E|+) y p(NE|+) de la prueba anterior (si dio positiva) o p(E|-) y p(NE|-) si dio negativa.
Problemas de probabilidad propuestos:
Problemas de probabilidad propuestos:

1 Una mujer es hija de una portadora de la enfermedad de Duchenne. Dicha mujer tiene tres
hijos sanos. Calcular la probabilidad de que ella sea portadora de la enfermedad.
Solucin
2 Una prueba diagnstica para el cncer uterino tiene un coeficiente falso-positivo de 0.05 y
falso-negativo de 0.10. Una mujer con una probabilidad pre-prueba de padecer la enfermedad
de 0.15 tiene un resultado negativo con la misma. Calcular la probabilidad de que no est
enferma.
Solucin
http://www.hrc.es/bioest/Probabilidad_pro.html [28/12/2002 18:13:09]
Problemas de probabilidad resueltos:
Problemas de probabilidad resueltos:

1 Una mujer es hija de una portadora de la enfermedad de Duchenne. Dicha mujer tiene tres
hijos varones sin la enfermedad. Calcular la probabilidad de que ella sea portadora de la
enfermedad.
Solucin
Si representamos por x el gen alterado y por X el gen normal, el espacio muestral para el
nacimiento de la mujer ={xX, XX}, cada suceso elemental con la misma probabilidad (1 ley
de Mendel). Por tanto, si A = {xX} = {la mujer es portadora}, segn la definicin clsica de
probabilidad p(A) = 1/2.
Si la mujer fuera portadora, los posibles genotipos para sus hijos son xX, xY, XX, XY, todos
con la misma probabilidad. El espacio muestral para el nacimiento de un hijo varn es ={xY,
XY}, por tanto la probabilidad de que un hijo varn no tenga la enfermedad es 1/2 (tambin
segn la definicin clsica). Cmo los genotipos de los sucesivos hijos son independientes (2
ley de Mendel), y de acuerdo a la definicin de independencia, la probabilidad de que los 3
hijos varones no tengan la enfermedad es (1/2)x(1/2)x(1/2) = 1/8. Obviamente si la mujer no
fuera portadora, la probabilidad de que los 3 hijos varones no tengan la enfermedad es 1.
Como el suceso A = {la mujer es portadora} y su complementario Ac = {la mujer no es
portadora} forman una particin, se puede aplicar el teorema de Bayes en relacin con el
suceso B = {los 3 hijos varones no tienen la enfermedad}
2 Una prueba diagnstica para el cncer uterino tiene un coeficiente falso-positivo de 0,05 y
falso-negativo de 0,10. Una mujer con una probabilidad pre-prueba de padecer la enfermedad
de 0,15 tiene un resultado negativo con la misma. Calcular la probabilidad de que no est
enferma.
Solucin
Sea NE = {la mujer no est enferma}, + = {el resultado de la prueba es positivo} y - = {el
resultado de la prueba es negativo}. La pregunta pide p(NE|-). Los datos que se dan son
p(+|NE)=0,05; p(-|E)=0,10 y p(E)=0,15. Del primero se deduce que p(-|NE)=0,95 y del ltimo
p(NE)=0,85, por lo tanto aplicando el teorema de Bayes
p(NE|--) = [ p(--|NE) p(NE) ] / [ p(--|NE) p(NE) + p(--|E) p(E) ]
p(NE|--) = [ 0,95 x 0,85 ] / [ 0,95 x 0,85 + 0,10 x 0,15 = 0,982
http://www.hrc.es/bioest/Probabilidad_prosul.html [28/12/2002 18:18:34]
REPASO DE ALGEBRA DE CONJUNTOS

V.Abraira
Definiciones
Dado un conjunto A={a, b, c, d}, la relacin de pertenencia se representa por a A.
Se llama cardinal del conjunto, y se representa car(A), al nmero de elementos que contiene.
Se llama conjunto vaco, y se representa por , al conjunto que no contiene ningn elemento. No desespere,
estamos de acuerdo en que si no contiene ningn elemento, no es un conjunto, sin embargo su definicin como tal es
muy til.
Se llama universo o conjunto universal, y se suele representar por H, al conjunto formado por todos los elementos
que se estn considerando.
Dado un conjunto A, se llama complementario del mismo, y se representa por Ac, al conjunto formado por los
elementos del universo que no son de A.
Dos conjuntos son iguales si estn formados por los mismos elementos.
Se dice que B es subconjunto de A, y se representa B A, si todos los elementos de B pertenecen a A. Se dice
tambin que B est incluido en A.
Dados dos conjuntos A y B, se llama unin de ambos, y se representa A B, al conjunto formado por los elementos
que pertenecen a A o a B.
Ejemplo 1: A={a, b, c, d} B={c, d, e, h}
A B = {a, b, c, d, e, h}
Ejemplo 2: C={personas obesas} D={personas hipertensas}
C D = {personas obesas o hipertensas}
Se llama interseccin y se representa A B, al conjunto formado por los elementos que pertenecen a A y a B.
Ejemplo 3: para los conjuntos anteriores
A B = {c, d} C D = {hipertensos y obesos}
Si dos conjuntos no tienen elementos comunes, se llaman disjuntos y su interseccin es el conjunto vaco. Si, para el
ejemplo 2, en el universo que se est considerando no hay nadie que sea hipertenso y obeso C D =
Al conjunto formado por todos los subconjuntos de un conjunto dado se le denomina conjunto de las partes del
conjunto o lgebra y se representa por P(A)
Ejemplo: A = {1, 2, 3}
P(A) = { , {1}, {2}, {3}, {1,2}, {1,3}, {2,3}, {1,2,3}}
Propiedades
Propiedades de la inclusin
i) A A
ii) A
iii) A B B A ; slo si A = B
iv) A B y B D ==> A D
http://www.hrc.es/bioest/Algebra_conjuntos.html (1 of 2) [28/12/2002 18:31:54]
Propiedades de la unin e interseccin
i) Identidad
A=A
A H = A
ii) Idempotencia
AA=A
AA=A
iii) Commutatividad
AB=BA
AB=BA
iv) Asociatividad
(A B) D = A (B D)
(A B) D = A (B D)
v) Distributividad
(A B) D = (A D) (B D)
(AB) D = (A D) (B D)
vi) Absorcin
A (A B) = A
A (A B) = A
vii) Complementaridad
A Ac = H
A Ac =
Nota: A todo conjunto en el que se hayan definido dos operaciones que tengan estas propiedades, se le denomina
Algebra de Boole.
Funcin de conjunto: toda regla que de un modo perfectamente determinado haga corresponder un nmero real a
cada elemento del conjunto. Se representa por
f: A
el nmero x que le corresponde al elemento a, se representa por x=f(a)
Se denomina imagen de la funcin al conjunto de nmeros que estn en correspondencia con algn elemento, a
travs de la funcin.
im f = { x ; a A , f(a)=x }
Volver
Ir a Bioestadstica
http://www.hrc.es/bioest/Algebra_conjuntos.html (2 of 2) [28/12/2002 18:31:54]
Estadstica
ESTADISTICA
V.Abraira
Referencia bibliogrfica
A.Prez de Vargas, V.Abraira. Bioestadstica. Centro de Estudios Ramn Areces. Madrid.
1996.
Definiciones
Conjunto de mtodos cientficos ligados a la toma, organizacin, recopilacin, presentacin
y anlisis de datos, tanto para la deduccin de conclusiones como para tomar decisiones
razonables de acuerdo con tales anlisis.
Arte de la decisin en presencia de incertidumbre.
Ciencia que sirve para demostrar que dos personas han comido 1/2 pollo cada una, cuando
en realidad una ha comido uno y la otra ninguno.
Por qu la estadstica?
Usaron la estadstica Galileo, Newton y Einstein?
En ciertas ciencias (Biologa, Ciencias Humanas, algunos campos de la Fsica, ...) aparece el
concepto de experimento aleatorio (experimento que repetido en las "mismas condiciones" no
produce el mismo resultado) y asociado al mismo el de variable aleatoria.
Una variable no aleatoria (asociada al resultado de una experiencia que s produce el mismo
resultado) est caracterizada por un valor para cada condicin.
Una variable aleatoria est caracterizada por la llamada funcin densidad de probabilidad, a
partir de la cual se obtienen las probabilidades para sus posibles valores para cada condicin.
Los objetivos de la investigacin cientfica se pueden entender, de un modo muy general, en
trminos de encontrar y describir las variables de inters y las relaciones entre ellas, para el
problema en estudio.
La estadstica es la ciencia que estudia los mtodos que permiten realizar este proceso para
variables aleatorias. Estos mtodos permiten resumir datos y acotar el papel de la casualidad
(azar).
Se divide en dos reas:
Estadstica descriptiva: Trata de describir las variables aleatorias en las "muestras".
Estadstica inductiva o inferencial: Trata de la generalizacin hacia las poblaciones de los
resultados obtenidos en las muestras y de las condiciones bajo las cuales estas conclusiones
son vlidas. Se enfrenta bsicamente con dos tipos de problemas:
Estimacin, que puede ser puntual o por intervalos.
http://www.hrc.es/bioest/estadis_1.html (1 of 2) [28/12/2002 18:41:40]
Estadstica
Contraste de hiptesis.
ESTADISTICA DESCRIPTIVA
La descripcin completa de una variable aleatoria est dada por su funcin densidad de
probabilidad (fdp).
Afortunadamente una gran cantidad de variables de muy diversos campos estn
adecuadamente descritas por unas pocas familias de fdps: binomial, Poisson, normal, gamma,
etc.
Dentro de cada familia, cada fdp est caracterizada por unos pocos parmetros, tpicamente
dos: media y varianza.
Por tanto la descripcin de una variable indicar la familia a que pertenece la fdp y los
parmetros correspondientes.
Ejemplo: (hipottico) la concentracin de glucosa en sangre en individuos no diabticos,
medida en mg/dl, es normal con media 98 y varianza 90.
El problema es cmo averiguar la fdp de una variable de inters?
La familia, generalmente, se sabe por resultados de la teora de la probabilidad, aunque, en
cada caso, conviene verificarlo. Para conocer los parmetros se deberan conocer los
resultados de todos los posibles experimentos (poblacin: conjunto de todos los valores de
una variable aleatoria). Generalmente la poblacin es inaccesible, bien es infinita, o aunque
finita suficientemente grande para ser inabordable. En consecuencia, se estudian muestras
(subconjuntos de la poblacin) que, en caso de ser aleatorias, permiten realizar estimaciones
tanto de la familia como de los parmetros de las fdps.
Muestra aleatoria: muestra elegida independientemente de todas las dems, con la misma
probabilidad que cualquier otra y cuyos elementos estn elegidos independientemente unos de
otros y con la misma probabilidad.
Mtodos grficos de representacin de muestras: El mtodo grfico ms frecuente es el
histograma, que puede adoptar distintas formas. Vanse algunos ejemplos.
Advertencias:
1 Estos diagramas tienen un fin descriptivo: deben ser fciles de leer.
2 El convenio es que la frecuencia sea proporcional al rea (es proporcional a la altura slo si
las barras tienen la misma anchura).
3 Para fines comparativos es mejor usar frecuencias relativas.
4 El nmero de clases (barras), cuando la variable no es cualitativa, no debe ser ni muy
grande ni muy pequeo. Generalmente se recomiendan entre 5 y 20 clases de igual tamao.
Otro criterio es usar la raz cuadrada del nmero de datos.
5 Los lmites de las clases no deben ser ambiguos, p.e. no deben coincidir con valores
posibles de los datos (una cifra decimal ms).
Medidas descriptivas
MEDIDAS DESCRIPTIVAS
Medidas de posicin o tendencia
Media muestral: Si tenemos X1, X2, ... , Xn datos, se llama media muestral de los mismos a su
media aritmtica
Moda muestral: El valor que ms se repite (puede no existir y si existe puede no ser nica).
Mediana muestral: Ordenando los Xi, el valor que est en el medio
Ejemplo: Sean los datos 3, 5, 7, 7, 8, 9

= 39/6 = 6,5;
= 7; moda = 7
Medidas de dispersin
Rango: Si Xi estn ordenados Xn - X1
Varianza:
aunque para el clculo se suele usar otra frmula ms cmoda
Desviacin tpica o estndar:
Ojo!! no confundir con error tpico o estndar

Coeficiente de variacin:
Medidas descriptivas
VARIABLE ALEATORIA
Variable aleatoria
Una funcin que asocia un nmero real, perfectamente definido, a cada punto muestral.
A veces las variables aleatorias (v.a.) estn ya implcitas en los puntos muestrales.
Ejemplo 1: Experiencia consistente en medir la presin sistlica de 100 individuos. Un punto
muestral (resultado de un experimento) es ya un nmero (presin sistlica). La v.a. est
implcita.
Ejemplo 2: En el ejemplo de la mujer portadora de hemofilia.
= {sss, ssn, sns, snn, nss, nsn, nns, nnn}
Se podra definir una variable que asignara a cada punto muestral el nmero de orden en el
espacio muestral.
X: sss
1; ssn
2; sns
3;...
Pero otra posible v.a.: a cada punto muestral el nmero de s. X: sss
3; ssn
2; ...
Los conjuntos pueden ser:

discretos: nmero finito o infinito numerable de elementos.
continuos: nmero infinito no numerable de elementos.
Las v.a. definidas sobre espacios muestrales discretos se llaman v.a. discretas y las definidas
sobre espacios muestrales continuos se llaman continuas.
Una v.a. puede ser continua, aunque nosotros slo podamos acceder a un subconjunto finito
de valores. P.e. la presin arterial es una v.a. continua pero slo podemos acceder a un
conjunto finito de valores por la limitacin de los aparatos de medida.
En general, las medidas dan lugar a v.a. continuas y los conteos a v.a. discretas.
Induccin de la probabilidad a variables aleatorias
Las v.a permiten definir la probabilidad como una funcin numrica (de variable real) en lugar
de como una funcin de conjunto como se haba definido antes
Ejemplo 3: Tiramos una moneda 3 veces. Representamos cara por c y cruz por z.
= {ccc, ccz, czc, zcc, czz, zcz, zzc, zzz}
La probabilidad de cada suceso elemental es 1/8. Por ejemplo p(ccc)=1/8, ya que la
probabilidad de sacar cara en una tirada es 1/2 segn la definicin clsica y las tiradas son
independientes.
Definimos la v.a. X: nmero de caras, que puede tomar los valores {0, 1, 2, 3}. Se buscan
todos los puntos muestrales que dan lugar a cada valor de la variable y a ese valor se le
asigna la probabilidad del suceso correspondiente.
VARIABLE ALEATORIA
Sucesos
px
{zzz}
1/8
{czz, zcz, zzc}
3/8
{ccz, czc, zcc}
3/8
{ccc}
1/8
A esta funcin se le denomina funcin densidad de probabilidad (fdp), que desgraciadamente

"funciona" de distinta manera en las variables discreta que en las continuas. En el caso de las
variables discretas, como en el ejemplo, es una funcin que para cada valor de la variable da
su probabilidad.
Ejemplo 4: Supongamos la variable tipo histolgico de un tumor, con los valores 1, 2, 3, 4. Si la
fdp fuera
f(x)
0,22
0,27
0,30
0,21
significara que la probabilidad del tipo 2 es 0,27, etc.

Para variables continuas la probabilidad de que una variable tome cualquier valor concreto es
0, por lo tanto la fdp slo permite calcular la probabilidad para un intervalo del tipo (a<X<b),
mediante el rea bajo la curva de la fdp.
VARIABLE ALEATORIA
Para las variables aleatorias de inters hay tablas, y programas de ordenador, donde buscar
esos valores.
Distribucin acumulativa o funcin de distribucin
F(x) = p(X x)
Para el ejemplo 3
f(x)
F(x)
1/8
1/8
3/8
4/8
3/8
7/8
1/8
8/8
y para el ejemplo 4
f(x)
F(x)
0,22
0,22
0,27
0,49
0,30
0,79
0,21
Parmetros caractersticos de una fdp

Valor esperado o esperanza matemtica o media
si X es una v.a. cualquier funcin de ella, h(x), es tambin una v.a., en consecuencia tambin
se define este parmetro para una funcin de v.a.
VARIABLE ALEATORIA
Ejemplo 5: Se tira un dado. Se define como v.a. el nmero que sale Cul es su media?
La variable X puede tomar los valores 1, 2, ..., 6 y para todos ellos f(x) = 1/6. En consecuencia
la media es
Observese que es un nmero que la v.a. no puede alcanzar. Qu significa? No mucho.

Se define ahora una funcin sobre X: el premio: si sale 1 2 se gana 100 ptas, si sale 3 se
gana 500 y si sale 4, 5 6 no se gana nada
h(x)
100
100
500
Cul es el valor medio de esta funcin?
qu significa? es el valor medio a la larga: si se juega un nmero grande de veces la

ganancia final es como si en cada jugada se hubiera ganado 116,6 pts. Si la apuesta costara
menos de eso el juego sera ventajoso para el jugador (as se enriqueci Voltaire), si costara
ms, para la banca. (llamar a sto honestidad del juego le cost el puesto de ministro a
Laplace).
Varianza:
Se define como:
aunque para el clculo se suele usar esta otra frmula equivalente:
VARIABLE ALEATORIA
Qu mide la varianza? Mide la dispersin de la variable alrededor de la media.

Otras lecturas recomendadas
Variables and parameters. Altman & Bland. BMJ 1999; 318:1667.
Problemas de estadstica propuestos
Problemas de estadstica propuestos (1 parte):

1 Un juego consiste en tirar dos dados. Si la suma de sus caras es mayor o igual a 10 se ganan 300 pts, si est
comprendida entre 7 y 9 se ganan 100 pts. y para cualquier otro resultado no se gana nada. Cul debera ser el precio
de la apuesta para que la ganancia esperada de la banca sea de 50 pts?
Solucin
2 La siguiente tabla muestra la fdp para la variable X: nmero de personas por da que solicitan un tratamiento
innecesario en el servicio de urgencias de un pequeo hospital.
f(x)
0,01
0,1
0,3
0,4
0,1
a. Encontrar f(5)
b. Construir F(x)
c. Encontrar p(X2)
d. Encontrar p(X<2)
e. Encontrar p(X>3)
f. Calcular la media y la varianza
Solucin
3 Se desarrolla un compuesto para aliviar las migraas. El fabricante afirma que es efectivo en un 90% de los casos. Se
prueba sobre 4 pacientes. Sea X el nmero de pacientes que obtiene alivio.
a. Encontrar la fdp para X, suponiendo que la afirmacin del fabricante sea correcta.
b. Encontrar p(X1)
c. Si el compuesto no alivia a ninguno de los pacientes es esa una razn para poner en duda la eficacia afirmada por el
fabricante? Razonar sobre la base de la probabilidad implicada.
d. Calcular la media. Qu significa en este ejemplo?
Solucin
4 Sea X el tiempo de supervivencia en aos despus de un diagnstico de leucemia aguda. La fdp para X es f(x) = -x/2
+ 1, para 0 < x < 2.
a. Comprobar que es una fdp.
b. Hallar p(X>1)
c. Hallar p(X=1)
d. Hallar p(X1)
Ayuda: hacerlo todo grficamente
e. Calcular la media y la varianza (Slo para iniciados).
Solucin
http://www.hrc.es/bioest/estadis_pro.html [28/12/2002 18:44:46]
Problemas de estadstica resueltos
Problemas de estadstica resueltos (1 parte):

1 Un juego consiste en tirar dos dados. Si la suma de sus caras es mayor o igual a 10 se ganan 300 pts, si est
comprendida entre 7 y 9 se ganan 100 pts. y para cualquier otro resultado no se gana nada. Cul debera ser el precio
de la apuesta para que la ganancia esperada de la banca sea de 50 pts?
Solucin
El espacio muestral para el problema es = {(1,1), (1,2), (1,3), ..., (6,6)} con 36 puntos muestrales. Todos los sucesos
elementales tiene la misma probabilidad 1/36.
Se define la v.a. X: suma de las dos caras. Esta variable puede tomar los valores 2, 3, 4, ....,12. La tabla con la fdp
inducida es
x
Sucesos
f(x)
{(1,1)}
1/36
{(1,2), (2,1)}
2/36
{(1,3), (2,2), (3,1)}
3/36
{(1,4), (2,3), (3,2), (4,1)}
4/36
{(1,5), (2,4), (3,3), (4,2), (5,1)}
5/36
{(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}
6/36
{(2,6), (3,5), (4,4), (5,3), (6,2)}
5/36
{(3,6), (4,5), (5,4), (6,3)}
4/36
10
{(4,6), (5,5), (6,4)}
3/36
11
{(5,6), (6,5)}
2/36
12
{(6,6)}
1/36
La tabla de la funcin premio es

x
h(x)
100
100
100
10
300
11
300
12
300
Por lo tanto el valor esperado del premio es
en consecuencia, la apuesta debera costar 91,7 + 50 = 141,7 para que la ganancia esperada de la banca sea 50 ptas.
2 La siguiente tabla muestra la fdp para la variable X: nmero de personas por da que solicitan un tratamiento
innecesario en el servicio de urgencias de un pequeo hospital.
http://www.hrc.es/bioest/estadis_prosul.html (1 of 4) [28/12/2002 18:45:31]
f(x)
0,01
0,1
0,3
0,4
0,1
a. Encontrar f(5)
b. Construir F(x)
c. Encontrar p(X2)
d. Encontrar p(X<2)
e. Encontrar p(X>3)
f. Calcular la media y la varianza
Solucin
a. Por la construccin de las fdps es obvio que
.
Para que se cumpla esta condicin es necesario que f(5)=0,09
b.
f(x)
0,01
0,1
0,3
0,4
0,1
0,09
F(x)
0,01
0,11
0,41
0,81
0,91
c. p(X2) = F(2) = 0,41

d. p(X<2) = p(X1) = F(1)=0,11
e. p(X>3) = 1 - p(3) = 1- F(3) = 1 - 0,81 = 0,19
f.
3 Se desarrolla un compuesto para aliviar las migraas. El fabricante afirma que es efectivo en un 90% de los casos. Se
prueba sobre 4 pacientes. Sea X el nmero de pacientes que obtiene alivio.
a. Encontrar la fdp para X, suponiendo que la afirmacin del fabricante sea correcta.
b. Encontrar p(X1)
c. Si el compuesto no alivia a ninguno de los pacientes es esa una razn para poner en duda la eficacia afirmada por el
fabricante? Razonar sobre la base de la probabilidad implicada.
d. Calcular la media. Qu significa en este ejemplo?
Solucin
a. Representando por a que un paciente tenga alivio y por n que no lo tenga, el espacio muestral para el problema es
= {aaaa, naaa, anaa, aana, aaan, ..., nnnn}, Si es cierta la afirmacin del fabricante p(a)=0,9 y p(n)=0,1
La v.a. X: nmero de pacientes que tienen alivio puede tomar los valores 0, 1, 2, 3, 4. La tabla con la fdp inducida es
x
Sucesos
f(x)
0,14
{nnnn}
{annn, nann, nnan, nnna}
4x0,9x0,13
{aann, anan, anna, naan, nana, nnaa }
6x0,92x0,12
{aaan, aana, anaa, naaa}
{aaaa}
4x0,93x0,1
0,94
b. p(X1) = f(0) + f(1) = 0,14 + 4x0,9x0,13 = 0,0037

c. La probabilidad de que no alivie a ningn paciente es f(0)=0,0001. Es una probabilidad tan baja que, efectivamente, si
ese fuera el resultado hay suficientes razones para poner en duda la afirmacin de que alivia al 90% de los pacientes.
d.
Si se repitiera un nmero suficientemente grande de veces la experiencia de administrar el frmaco a 4 pacientes, el

nmero promedio de pacientes que experimentaran alivio sera 3,6.
4 Sea X el tiempo de supervivencia en aos despus de un diagnstico de leucemia aguda. La fdp para X es f(x) = -x/2
+ 1, para 0 < x < 2.
a. Comprobar que es una fdp.
b. Hallar p(X>1)
c. Hallar p(X=1)
d. Hallar p(X1)
Ayuda: hacerlo todo grficamente
e. Calcular la media y la varianza (Slo para iniciados).
Solucin
a. La grfica de la fdp es
La condicin equivalente a
para variables continuas es que el rea bajo la fdp sea 1. De

modo general ese rea se calcula mediante clculo integral,
pero en este caso se puede calcular por la conocida frmula
del rea de un tringulo A = (bxh)/2, es decir A = (2x1)/2=1
b.
Grficamente, la probabilidad pedida es el rea coloreada de
verde, por lo tanto se puede calcular tambin con la frmula
del rea del tringulo. Ahora b=1 y para calcular h hay que
ver que valor toma la fdp cuando x=1, y = -1/2 + 1 = 1/2. Por
lo tanto, la probabilidad es (1x1/2)/2 = 1/4
c. Como en toda variable continua la probabilidad de que tome un valor concreto es 0, por lo tanto p(X=1) = 0
d. Obviamente p(X1) = p(X >1) = 1/4
e. Media
varianza
Estadstica inferencial: estimacin de parmetros y contrastes de hiptesis
Estadstica inferencial
Los dos tipos de problemas que resuelven las tcnicas estadsticas son: estimacin y contraste
de hiptesis. En ambos casos se trata de generalizar la informacin obtenida en una muestra a
una poblacin. Estas tcnicas exigen que la muestra sea aleatoria. En la prctica rara vez se
dispone de muestras aleatorias, por la tanto la situacin habitual es la que se esquematiza en
la figura
Entre la muestra con la que se trabaja y la poblacin de inters, o poblacin diana, aparece la
denominada poblacin de muestreo: poblacin (la mayor parte de las veces no definida con
precisin) de la cual nuestra muestra es una muestra aleatoria. En consecuencia la
generalizacin est amenazada por dos posibles tipos de errores: error aleatorio que es el que
las tcnicas estadsticas permiten cuantificar y crticamente dependiente del tamao muestral,
pero tambin de la variabilidad de la variable a estudiar y el error sistemtico que tiene que ver
con la diferencia entre la poblacin de muestreo y la poblacin diana y que slo puede ser
controlado por el diseo del estudio.
Tamao muestral
El tamao muestral juega el mismo papel en estadstica que el aumento de la lente en
microscopa: si no se ve una bacteria al microscopio, puede ocurrir que:
- la preparacin no la contenga
- el aumento de la lente sea insuficiente.
Para decidir el aumento adecuado hay que tener una idea del tamao del objeto.
Del mismo modo, para decidir el tamao muestral:
i) en un problema de estimacin hay que tener una idea de la magnitud a estimar y del error
aceptable.
ii) en un contraste de hiptesis hay que saber el tamao del efecto que se quiere ver.
http://www.hrc.es/bioest/Introducion.html [28/12/2002 18:46:52]
Estimacin de parmetros
Estimacin de parmetros
En general, de las variables experimentales u observacionales no conocemos la fpd. Podemos
conocer la familia (normal, binomial,...) pero no los parmetros. Para calcularlos
necesitaramos tener todos los posibles valores de la variable, lo que no suele ser posible.
La inferencia estadstica trata de cmo obtener informacin (inferir) sobre los parmetros a
partir de subconjuntos de valores (muestras) de la variable.
Estadstico: variable aleatoria que slo depende de la muestra aleatoria elegida para
calcularla.
Estimacin: Proceso por el que se trata de averiguar un parmetro de la poblacin
representado, en general, por a partir del valor de un estadstico llamado estimador y
representado por
El problema se resuelve en base al conocimiento de la "distribucin muestral" del estadstico
que se use.
Qu es esto? Concretemos, p.e. en la media (). Si para cada muestra posible calculamos la
media muestral (
) obtenemos un valor distinto (
es un estadstico: es una variable
aleatoria y slo depende de la muestra), habr por tanto una fpd para , llamada distribucin
muestral de medias. La desviacin tpica de esta distribucin se denomina error tpico de la
media. Evidentemente, habr una distribucin muestral para cada estadstico, no slo para la
media, y en consecuencia un error tpico para cada estadstico.
Si la distribucin muestral de un estadstico estuviera relacionada con algn parmetro de
inters, ese estadstico podra ser un estimador del parmetro.
http://www.hrc.es/bioest/Introducion_est.html [28/12/2002 18:47:24]
Distribuccin muestral de medias
Distribucin muestral de medias

Si tenemos una muestra aleatoria de una poblacin N(, ), se sabe (Teorema del lmite central) que la fdp de la
media muestral es tambin normal con media y varianza 2/n. Esto es exacto para poblaciones normales y
aproximado (buena aproximacin con n>30) para poblaciones cualesquiera. Es decir
error estndar de la media.
es el error tpico, o
Cmo usamos esto en nuestro problema de estimacin?

1 problema: No hay tablas para cualquier normal, slo para la normal =0 y =1 (la llamada z); pero haciendo la
transformacin (llamada tipificacin)
una normal de media y desviacin se transforma en una z.

Llamando z al valor de una variable normal tipificada que deja a
su derecha un rea bajo la curva de , es decir, que la
probabilidad que la variable sea mayor que ese valor es (estos
son los valores que ofrece la tabla de la normal)
podremos construir intervalos de la forma
para los que la probabilidad es 1 - .
Teniendo en cuenta la simetra de la normal y manipulando algebracamente
que tambin se puede escribir
o, haciendo nfasis en que
es el error estndar de la media,
Recurdese que la probabilidad de que est en este intervalo es 1 - . A un intervalo de este tipo se le denomina
intervalo de confianza con un nivel de confianza del 100(1 - )%, o nivel de significacin de 100%. El nivel de
confianza habitual es el 95%, en cuyo caso =0,05 y z /2=1,96. Al valor
se dice que
es un estimador de .
http://www.hrc.es/bioest/esti_medias.html (1 of 2) [28/12/2002 18:48:00]
se le denomina estimacin puntual y
Distribuccin muestral de medias
Ejemplo: Si de una poblacin normal con varianza 4 se extrae una muestra aleatoria de tamao 20 en la que se
calcula
se puede decir que tiene una probabilidad de 0,95 de estar comprendida en el intervalo
que sera el intervalo de confianza al 95% para

En general esto es poco til, en los casos en que no se conoce tampoco suele conocerse 2; en el caso ms
realista de 2 desconocida los intervalos de confianza se construyen con la t de Student (otra fdp continua para la
que hay tablas) en lugar de la z.
o, haciendo nfasis en que
es el error estndar estimado de la media,
Este manera de construir los intervalos de confianza slo es vlido si la variable es normal. Cuando n es grande
(>30) se puede sustituir t por z sin mucho error.
Interpreting study results: confidence intervals. Guyatt et al. CMAJ. 152:169-173. 1995
http://www.hrc.es/bioest/esti_medias.html (2 of 2) [28/12/2002 18:48:00]
Estimacin de proporciones
Estimacin de proporciones
Sea X una variable binomial de parmetros n y p (una variable binomial es el nmero de xitos
en n ensayos; en cada ensayo la probabilidad de xito (p) es la misma, por ejemplo: nmero
de diabticos en 2000 personas).
Si n es grande y p no est prximo a 0 1 (np 5) X es aproximadamente normal con media
np y varianza npq (siendo q = 1 - p) y se puede usar el estadstico
(proporcin
muestral), que es tambin aproximadamente normal, con error tpico dado por
en consecuencia, un IC para p al 100(1 - )% ser
es decir, la misma estructura que antes:

Obsrvese que para construirlo, se necesita conocer p!. Si n es grande (>30) se pueden
substituir p y q por sus estimadores sin mucho error, en cualquier caso como pq 0,25 si se
substituye pq por 0,25 se obtiene un intervalo ms conservador (ms grande).
Ejemplo: En una muestra de 100 pacientes sometidos a un cierto tratamiento se obtienen 80
curaciones. Calcular el intervalo de confianza al 95% de la eficacia del tratamiento.
Qu significa este intervalo? La verdadera proporcin de curaciones est comprendida entre,

aproximadamente, 72% y 88% con un 95% de probabilidad.
Es suficientemente preciso? Habr que juzgarlo con criterios clnicos.
http://www.hrc.es/bioest/esti_propor.html [28/12/2002 18:50:15]

1 En una muestra aleatoria de 90 pacientes se mide el nivel de glucosa en sangre en ayunas.
Se obtiene
hecho?
= 132 mg/dl y s2=109. Construir el IC al 95% para Qu asuncin se ha
Solucin
2 Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo.
Se eligen aleatoriamente a 100 de ellos y se les suministra la vacuna; de ellos 10 pasan la
gripe. Construir un IC al 95% para la probabilidad de pasar la gripe si se est vacunado. En los
otros 100 pacientes sin vacunar la pasan 20. Hay evidencia de que la vacuna es eficaz?
Solucin
http://www.hrc.es/bioest/estadis_pro2.html [28/12/2002 18:50:45]
Problemas de estadstica resueltos (2 parte):

1 En una muestra aleatoria de 90 pacientes se mide el nivel de glucosa en sangre en ayunas.
Se obtiene
hecho?
= 132 mg/dl y s2=109. Construir el IC al 95% para Qu asuncin se ha
Solucin
Usando la frmula general para cuando 2 es desconocida
podemos, o bien mirar a las tablas de la t (o en un programa de ordenador) el valor de t0,025

que para 89 grados de libertad (los grados de libertad son n - 1) es 1,99, o bien como n > 30
aproximar a la z y usar el valor 1,96.
Para poder usar esta frmula es necesario que la variable sea normal. es abusiva esta
asuncin? Ver, por ejemplo The normal distribution. Altman & Bland. BMJ 1995; 310:298.
2 Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo.
Se eligen aleatoriamente a 100 de ellos y se les suministra la vacuna; de ellos 10 pasan la
gripe. Construir un IC al 95% para la probabilidad de pasar la gripe si se est vacunado. En los
otros 100 pacientes sin vacunar la pasan 20. Hay evidencia de que la vacuna es eficaz?
Solucin
La frmula para calcular IC para proporciones es
y aproximando p y q por sus estimaciones
es decir, hay una probabilidad del 95% de que la probabilidad de pasar la gripe si se est
vacunado est comprendida entre el 4% y el 16%. Para los no vacunados
Existe solapamiento, aunque pequeo, entre ambos intervalos; por tanto no podemos asegurar
que la vacuna sea eficaz.
http://www.hrc.es/bioest/estadis_pro2sul.html (1 of 2) [28/12/2002 18:50:58]
Contrastes de hiptesis
Una hiptesis estadstica es una asuncin relativa a una o varias poblaciones,
que puede ser cierta o no. Las hiptesis estadsticas se pueden contrastar con
la informacin extrada de las muestras y tanto si se aceptan como si se
rechazan se puede cometer un error.
La hiptesis formulada con intencin de rechazarla se llama hiptesis nula y se
representa por H0. Rechazar H0 implica aceptar una hiptesis alternativa (H1).
La situacin se puede esquematizar:
H0 rechazada
H0 cierta
H0 falsa
H1 cierta
Error tipo I ()
Decisin correcta (*)
H0 no rechazada Decisin correcta
Error tipo II ()
(*) Decisin correcta que se busca

=p(rechazar H0|H0 cierta)
=p(aceptar H0|H0 falsa)
Potencia=1-=p(rechazar H0|H0 falsa)
Detalles a tener en cuenta:
1 y estn inversamente relacionadas.
2 Slo pueden disminuirse las dos, aumentando n.
Los pasos necesarios para realizar un contraste relativo a un parmetro son:
1. Establecer la hiptesis nula en trminos de igualdad
2. Establecer la hiptesis alternativa, que puede hacerse de tres maneras,

dependiendo del inters del investigador
en el primer caso se habla de contraste bilateral o de dos colas, y en los otros

dos de lateral (derecho en el 2 caso, o izquierdo en el 3) o una cola.
http://www.hrc.es/bioest/Introducion_ch.html (1 of 4) [28/12/2002 18:54:24]
3. Elegir un nivel de significacin: nivel crtico para

4. Elegir un estadstico de contraste: estadstico cuya distribucin muestral se
conozca en H0 y que est relacionado con y establecer, en base a dicha
distribucin, la regin crtica: regin en la que el estadstico tiene una
probabilidad menor que si H0 fuera cierta y, en consecuencia, si el estadstico
cayera en la misma, se rechazara H0.
Obsrvese que, de esta manera, se est ms seguro cuando se rechaza una
hiptesis que cuando no. Por eso se fija como H0 lo que se quiere rechazar.
Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha
podido rechazar. Por otro lado, la decisin se toma en base a la distribucin
muestral en H0, por eso es necesario que tenga la igualdad.
5. Calcular el estadstico para una muestra aleatoria y compararlo con la regin
crtica, o equivalentemente, calcular el "valor p" del estadstico (probabilidad de
obtener ese valor, u otro ms alejado de la H0, si H0 fuera cierta) y compararlo
con .
Ejemplo:
Estamos estudiando el efecto del estrs sobre la presin arterial. Nuestra
hiptesis es que la presin sistlica media en varones jvenes estresados es
mayor que 18 cm de Hg. Estudiamos una muestra de 36 sujetos y encontramos
1. Se trata de un contraste sobre medias. La hiptesis nula (lo que queremos

rechazar) es:
2. la hiptesis alternativa
es un contraste lateral derecho.

3. Fijamos "a priori" el nivel de significacin en 0,05 (el habitual en Biologa).
4. El estadstico para el contraste es
y la regin crtica T>t

Si el contraste hubiera sido lateral izquierdo, la regin crtica sera T<t1-

y si hubiera sido bilateral T<t1-/2 o T>t/2
En este ejemplo t(35)0,05=1,69.
5. Calculamos el valor de t en la muestra
no est en la regin crtica (no es mayor que 1,69), por tanto no rechazamos H0.
Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes
estadsticos) es buscar en las tablas el "valor p" que corresponde a T=0,833,
que para 35 g.l. es aproximadamente 0,20. Es decir, si H0 fuera cierta, la
probabilidad de encontrar un valor de T como el que hemos encontrado o mayor
(por qu mayor? Porque la H1 es que es mayor , lo que producira una media
muestral mayor y por tanto mayor valor de t) es 0,20, dicho de otra manera la
probabilidad de equivocarnos si rechazamos H0 es 0,20, como la frontera se
establece en 0,05 no la rechazamos.
Este valor crtico de 0,05 es arbitrario pero es la convencin habitual. Cun
razonable es?
Problema al respecto: en la hiptesis de que un mazo de cartas est bien
barajado, la probabilidad de que al sacar dos cartas sean, p.e.:1 el as de oros y
2 el rey de bastos es 1/40 x 1/39=0,000833.
Si hacemos la experiencia y obtenemos ese resultado rechazaramos la
hiptesis de que el mazo est bien barajado? Cunto se parece esto a la lgica
del contraste de hiptesis?
Volvamos al problema del estrs. Como no se rechaza H0, se puede cometer un
error tipo II. Cul es ?. De hecho, sera la informacin relevante a comunicar
en este estudio (la probabilidad del error que se pude cometer en l).
Habitualmente, sin embargo, no se da porque los paquetes estadsticos no la
calculan.
Para calcularla se debe concretar H1, p.e. = 20 (el criterio para este valor no
es estadstico)
=p(aceptar H0|H1 cierta)

Supongamos que el tamao muestral sea suficientemente grande para poder
aproximar t a z.
Cundo se acepta H0? si z 1,69
es decir, se acepta H0 si
Qu probabilidad hay de encontrar
si = 20 (zona verde del grfico)?
En esta hiptesis lo que se distribuye como una z es

Hypothesis testing. Guyatt et al. CMAJ. 152:27-32. 1995
Tamao muestral en contrastes sobre medias
Clculo del tamao muestral para contrastes sobre medias

Sea el contraste (bilateral)
H0: = 0
H1: > 0
Para calcular el tamao muestral debemos, adems de fijar
y , concretar H1
Concretando H1: = 0 + .
Si n suficientemente grande para poder usar la normal, es
decir
resulta que
Si el contraste fuera a dos colas habra que cambiar z por z/2
http://www.hrc.es/bioest/tamano.html [28/12/2002 18:55:02]
Comparacin de medias
La hiptesis nula
H0: 1 2 = d0
Generalmente d0=0
Hay 3 situaciones distintas:
1
conocidos (poco frecuente).
desconocidos pero iguales.
desconocidos pero distintos.
Los estadsticos son distintos (z en 1 y t en 2 y 3) pero el procedimiento es el mismo. En los 3 casos se

supone que las muestras son independientes; si no lo fueran hay otro estadstico (t pareada).
Todos asumen normalidad. Si no se cumpliera hay que usar los llamados test no paramtricos.
Ejemplo
En un ensayo clnico para evaluar un hipotensor se compara un grupo placebo con el grupo tratado. La
variable medida es la disminucin de la presin sistlica y se obtiene: grupo placebo n = 35;
Hg. y s2 = 33,9; grupo tratado n = 40;
= 3,7 mm de
= 15,1 mm de Hg. y s2 = 12,8. Es eficaz el tratamiento?
Se trata de un contraste sobre diferencias de medias

H0: T P = 0
H1: T P > 0
Como no conocemos las varianzas, para realizarlo debemos decidir si son iguales o distintas, para ello se
plantea el contraste
H0:
H1:
El estadstico es
, para el que p<0,05, en consecuencia rechazamos la H0
y concluimos que las varianzas son distintas. Por lo tanto usaramos la t para varianzas distintas. Haciendo
los clculos t=-10,2 p<0,05 rechazamos la H0 y concluimos que las medias son distintas.
Nota: Para hacerlo con un paquete estadstico, p.e. el SPSS, deberamos crear un archivo con 2 variables:
Trata (con un cdigo distinto para cada grupo, p.e. 0 para placebo y 1 para tratado) y Diferen con la
diferencia de presin arterial para cada individuo al acabar el estudio y al empezar. Originalmente en el
archivo podra haber una variable con la presin al empezar y otra al acabar y se creara la diferencia con la
opcin: Transformar ---> Calcular. Para calcular la t desplegamos los mens que se ven en la grfica:
http://www.hrc.es/bioest/ch_medias.html (1 of 3) [28/12/2002 18:55:43]
Y el programa calcula la t para varianzas iguales y distintas y realiza el contraste para las varianzas. Para el
contraste sobre las varianza el SPSS no usa la prueba descrita ms arriba, sino la de Levene que no asume
normalidad y se puede usar para comparar varias varianzas.
Estadsticos del grupo
TRATA
Media
35
3,729
5,666
,958
40
15,075
3,576
,565
DIFEREN
Desviacin Error tp. de

tp.
la media
Prueba de muestras independientes

Prueba de Levene
para la igualdad de
varianzas
F
DIFEREN
Se han
asumido
varianzas
iguales
No se han
asumido
varianzas
iguales
10,431
Sig.
,002
Prueba T para la igualdad de medias
gl Sig. (bilateral)
Diferencia de
medias
Error tp de la Intervalo de confianza para la

diferencia
diferencia
Inferior
Superior
-10,503
73
,000
-11,346
1,080
-13,500
-9,193
-10,201
55,909
,000
-11,346
1,112
-13,575
-9,118
Qu nos est diciendo este resultado? Que si el tratamiento fuera igual de eficaz que el placebo, la
probabilidad de haber obtenido una diferencia entre ambos como la que hemos encontrado o mayor es muy
pequea (<0,000) Bastara esto para convencernos de que debemos tratar con este tratamiento?
Contrastes sobre v.a. cualitativas
Contrastes sobre independencia de v.a. cualitativas

Se quiere estudiar un posible factor pronstico del xito de una terapia, p.e. cierto grado de albuminuria como
mal pronstico en la dilisis. Los resultados de un estudio de este tipo se pueden comprimir en una tabla 2x2 del
tipo
F
nF
m = a+b
nE
n = c+d
e = a+c
f = b+d
Se estudian T individuos, a tienen al factor (F) y tiene xito la terapia (E), b no tienen al factor (nF) y tiene xito la
terapia, ...
Ojo! A pesar de la aparente "inocencia" de esta tabla, puede significar cosas distintas segun el diseo del
estudio. No todas las probabilidades de las que se habla ms abajo se pueden estimar siempre.
H0 es que el factor F y el xito E son independientes (F no es factor pronstico) y H1 que estn asociados (s es
factor pronstico). Si son independientes p(EF) = p(E)p(F). A partir de los datos de la tabla las mejores
estimaciones de estas probabilidades son
, por lo tanto en H0
(cociente entre el producto

en consecuencia el valor esperado para esa celda en H0 es
de los totales marginales y el gran total), del mismo modo se calculan los dems valores esperados y se
construye el estadstico
que se distribuye segn una distribucin conocida denominada ji-cuadrado, que depende de un parmetro
llamado "grados de libertad" (g.l.) Los g.l. en esta tabla son 1. Esto se puede generalizar a tablas CxF y los
grados de libertad son (C-1)x(F-1).
Ejemplo
En una muestra de 100 pacientes que sufrieron infarto de miocardio se observa que 75 sobrevivieron ms de 5
aos (xito). Se quiere estudiar su posible asociacin con la realizacin de ejercicio moderado (factor). La tabla
es
F
nF
50
25
75
nE
10
15
25
60
40
100
Calculamos los valores esperados en H0

F
nF
60x75/100=45
40x75/100=30
nE
60x25/100=15
40x25/100=10
Obsrvese que una vez calculado uno de los valores esperados, los dems vienen dados para conservar los
http://www.hrc.es/bioest/ch_cualitativas.html (1 of 3) [28/12/2002 18:57:07]
totales marginales (eso es lo que significa que hay 1 g.l.). A partir de aqu calculamos
Rechazamos la H0 y concluimos que hay asociacin entre el ejercicio y la supervivencia. Obviamente esta
asociacin no es necesariamente causal.
Nota: Para hacerlo con un paquete estadstico, p.e. el SPSS, deberamos crear un archivo con 2 variables: Super
con un cdigo distinto para cada grupo, p.e. 1 para supervivencia y 0 para no y Ejer tambin con dos cdigos.
Para calcular la ji-cuadrado desplegamos los mens que se ven en la grfica:
y la salida es
Tabla de contingencia EJERC * SUPER
Recuento
SUPER
EJERC
Total
15
25
40
10
50
60
25
75
100
Total
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Valor
gl
Sig. asint.
(bilateral)
5,556
,018
Sig. exacta Sig. exacta (unilateral)

(bilateral)
Correccin de continuidad
4,500
,034
Razn de verosimilitud
5,475
,019
Estadstico exacto de Fisher
,033
Asociacin lineal por lineal
5,500
N de casos vlidos
100
,019
a Calculado slo para una tabla de 2x2.

b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 10,00.
,017
Estadsticos de fuerza de la asociacin

Cul es la fuerza de la asociacin? Ni el estadstico 2 ni su valor p asociado miden esa
fuerza, es decir se puede encontrar un alto valor de 2 (pequeo valor de p) con una
asociacin dbil si el tamao muestral fuera grande. Hay varios estadsticos propuestos para
medir esta fuerza:
1 Diferencia de riesgo o Reduccin absoluta del riesgo (RAR): A partir de la tabla del ejemplo
anterior podemos estimar la probabilidad (riesgo en la terminologa epidemiolgica) de que un
individuo que haga ejercicio tenga xito:
y tambin la probabilidad de que lo
. Se llama Diferencia de riesgo o Reduccin

tenga uno que no lo haga:
absoluta del riesgo a esta diferencia: 0,20 que puede oscilar entre -1 y 1; 0 indica no
asociacin.
2 Reduccin relativa del riesgo (RRR): La magnitud de la diferencia de riesgo es difcil de
interpretar: una diferencia de 0,001 puede ser mucho o poco dependiendo del riesgo basal.
Para superar esta dificultad se define la RRR como la reduccin absoluta del riesgo dividida
por el riesgo basal o riesgo del grupo de referencia. En el ejemplo, si consideramos como
referencia el no hacer ejercicio, el RRR sera 0,20/0,63 = 0,32.
3 Riesgo relativo (RR): Otro ndice relativo es el riesgo relativo definido como el cociente entre
los riesgos. En el ejemplo anterior RR=0,83/0,63=1,32. Los individuos que hacen ejercicio
tienen una probabilidad de xito 1,32 veces mayor que los que no. El RR puede oscilar entre 0
y
; 1 indica no asociacin. Es el estadstico preferido.
4 Odds ratio (OR): Es un estadstico menos intuitivo que el RR. Para caracterizar un proceso
binomial se puede usar su probabilidad (p) o el cociente p/q llamado odds. En el ejemplo
anterior, para el ejercicio p = 0,83 y el odds = 0,83/0,17=4,88, es decir es 4,88 veces ms
probable tener xito que no tenerlo si se hace ejercicio y para el no ejercicio p = 0,63 y el odds
= 0,63/0,37=1,70. Para comparar ambos procesos podemos usar su cociente u odds ratio OR
= 4,88/1,70 = 2,87. El odds para el ejercicio es 2,87 veces mayor que para el no ejercicio. El
; 1 indica no asociacin. Queda como ejercicio para el

OR tambin puede oscilar entre 0 y
lector comprobar que el OR se puede estimar como el cociente de los productos cruzados de
los elementos de la tabla, OR=(50x15)/(10x25)=3. La diferencia con el anterior es debida a
errores de redondeo.
Qu ventajas tiene el OR frente al RR?. En principio parece menos intuitivo aunque un
jugador no opinara lo mismo. De hecho el OR proviene del mundo de las apuestas. Si
queremos comparar dos juegos qu da ms informacin el OR o el RR? ... y si queremos
comparar dos estrategias teraputicas?
Por otro lado si el estudio del ejemplo anterior se hubiera hecho de otra forma: muestreando
por un lado individuos con xito y por otro sin xito (diseo caso-control) el RR no se podra
estimar y sin embargo el OR s y de la misma forma (se puede demostrar usando el teorema
de Bayes).
Adems, cuando se estudian fenmenos con probabilidades bajas (tpicamente enfermedades)
el OR tiende al RR.
http://www.hrc.es/bioest/fuerza_asocia.html (1 of 2) [28/12/2002 18:58:29]
Sean dos fenmenos con probabilidades p1 y p2 prximas a cero, en consecuencia q1 y q2

estarn prximos a 1 y su cociente tambin, por lo tanto
Resumiendo, el OR se puede estimar en diseos como el caso-control en los que el RR no se

puede y si se estudian fenmenos con baja prevalencia el OR estima el RR. Adems el OR es
un buen indicador en s mismo.
5 Nmero necesario a tratar (NNT): En el contexto de la evaluacin de tratamientos (ensayos
clnicos) se suele usar este ndice definido como el nmero de personas que se necesitara
tratar con un tratamiento para producir, o evitar, una ocurrencia adicional del evento. Del
mismo modo se define nmero necesario para perjudicar (NNP) para evaluar efectos
indeseables. Se calcula como el inverso del RAR. En el ejemplo NNT = 1/0,20 = 5 que se
interpreta como por cada 5 pacientes que hagan ejercicio se consigue que uno tenga xito.
Assessing the effects of treatment: measures of association. Jaeschke et al. CMAJ. 152:351357. 1995
Medidas del efecto de un tratamiento (I): reduccin absoluta del riesgo, reduccin relativa del
riesgo y riesgo relativo. Abraira SEMERGEN 26: 535-536. 2000.
Medidas del efecto de un tratamiento (II): odds ratio y numero necesario para tratar. Abraira
SEMERGEN 27: 418-420. 2001.
http://www.hrc.es/bioest/fuerza_asocia.html (2 of 2) [28/12/2002 18:58:29]

1 Plantear (y resolver) el contraste de hiptesis adecuado para el problema 2 de la serie
anterior.
Solucin
2 Antiguos estudios muestran que el germicida DDT puede acumularse en el cuerpo. En
1965, la concentracin media de DDT en las partes grasas del cuerpo en la poblacin
espaola era de 9 ppm. Se espera que como resultado de los controles realizados esta
concentracin haya disminuido.
a. Construir la hiptesis nula y alternativa para documentar esta afirmacin.
b. Explicar en trminos prcticos las consecuencias de cometer un error tipo I y
un error tipo II.
c. Se realiza el contraste de forma que la potencia para detectar una
concentracin media de 6 ppm es de 0,8. Explicar en trminos prcticos qu
significa.
Solucin
3 En un estudio caso-control para estudiar la posible asociacin entre estado civil y mortalidad
en la UVI se ha encontrado que de 50 personas que murieron 30 eran solteros, mientras que
entre 60 que sobrevivieron slo lo eran 15. Plantear y resolver el contraste. Cul sera el
mejor estimador del efecto?
Solucin
http://www.hrc.es/bioest/estadis_pro3.html [28/12/2002 19:00:49]

1 Plantear (y resolver) el contraste de hiptesis adecuado para el problema 2 de la serie
anterior: Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de
riesgo. Se eligen aleatoriamente a 100 de ellos y se les suministra la vacuna; de ellos 10
pasan la gripe. En los otros 100 pacientes sin vacunar la pasan 20. Hay evidencia de que la
vacuna es eficaz?
Solucin
H0: No hay asociacin entre la vacuna y la gripe (la vacuna no es eficaz)
Construimos la tabla
V
nV
10
20
30
nG
90
80
170
100
100
200

V
nV
100x30/200=15
100x30/200=15
nG
100x170/200=85
100x170/200=85
Calculamos el estadstico 2
Como el valor crtico de 2 es 3,84 rechazamos la H0 y concluimos que la vacuna es eficaz.

2 Antiguos estudios muestran que el germicida DDT puede acumularse en el cuerpo. En
1965, la concentracin media de DDT en las partes grasas del cuerpo en la poblacin
espaola era de 9 ppm. Se espera que como resultado de los controles realizados esta
concentracin haya disminuido.
a. Construir la hiptesis nula y alternativa para documentar esta afirmacin.
b. Explicar en trminos prcticos las consecuencias de cometer un error tipo I y
un error tipo II.
c. Se realiza el contraste de forma que la potencia para detectar una
concentracin media de 6 ppm es de 0,8. Explicar en trminos prcticos qu
significa.
Solucin
a. Llamando a a la concentracin media antes y d a la concentracin media ahora, las
hiptesis se plantean
H0: a = d
H1: a > d
b. Error tipo I = (rechazar H0|H0 cierta) es decir concluir que la concentracin ha disminuido,
cuando en realidad no ha sido as.
Error tipo II = (aceptar H0|H0 falsa) es decir concluir que la concentracin no ha disminuido,
cuando en realidad si ha disminuido
c. El diseo garantiza que si la concentracin media ha disminuido 6 ppm o ms el estudio
tiene una probabilidad de 0,8 de detectarlo.
3 En un estudio caso-control para estudiar la posible asociacin entre estado civil y mortalidad
en la UVI se ha encontrado que de 50 personas que murieron 30 eran solteros, mientras que
entre 60 que sobrevivieron slo lo eran 15. Plantear y resolver el contraste. Cul sera el
mejor estimador del efecto?
Solucin
H0: No hay asociacin entre el estado civil y la mortalidad
Construimos la tabla
Soltero
No
Morir
30
20
50
No
15
45
60
45
65
110

Soltero
no
Morir
45x50/110=20,5
65x50/110=29,5
No
45x60/110=24,5
65x60/110=35,5
Calculamos el estadstico 2
Como el valor crtico de 2 es 3,84 rechazamos la H0 y concluimos que hay asociacin. El

mejor estimador de la fuerza de la asociacin (realmente el nico posible de los que hemos
visto para este tipo de estudios) es el OR estimado como
Introduccin a la causalidad
1 Causalidad en la vida comn: Parece que forma parte de la mente humana el buscar relaciones entre las
cosas y particularmente entre acciones y sus consecuencias como modo de entender el mundo y adaptarse
al mismo. Ya figura en el aprendizaje del nio, incluso la repeticin.
Sin embargo en el lenguaje comn e incluso literario se usa con mucha laxitud:
"Un hombre entr en un local provocando una nube de humo, se alis el cabello provocando la aparicin de
un barman de aspecto feroz". Queneau.
"Sobre como la divina providencia regula la igualdad en el nacimiento de los sexos". Arthunot.
2 Causalidad en la filosofa: Para Aristteles (visin finalista) existen 4 tipos de causa:
Causa material: el mrmol para una estatua,la existencia del miocardio y su necesidad de riego sanguneo
para el infarto de miocardio.
Causa eficiente: la mano del escultor para la estatua, el trombo para el infarto.
Causa formal: el canon de belleza para la estatua, la necesidad de nutrientes para el infarto.
Causa final: depende de posiciones "a priori": el aumento de la belleza en el mundo para la estatua, para la
regulacin de la poblacin en el mundo o para que existan cardilogos para el infarto.
Evidentemente estos conceptos se solapan.
No es infrecuente encontrar esta visin finalista en Biologa: "El sistema inmunolgico est para defender al
individuo de ataques externos".
Otras posiciones:
i) ontolgica (Leibniz): La causalidad es un principio del ser. "Las leyes causales que una cosa cumple
constituyen un aspecto fundamental e inseparable de su modo de ser". D. Bohm.
ii) legalista (Hume): La causalidad es la forma en que se expresan las leyes cientficas basadas en una
generalizacin de la experiencia y con capacidad predictiva. Las caractersticas de la relacin causal son:
a) contigidad (causa y efecto deben estar contiguos en espacio y tiempo).
b) prioridad (la causa precede en el tiempo al efecto).
c) conjuncin constante (las relaciones anteriores deben conservarse en varios casos).
iii) a priorista (Kant): La causalidad es un "a priori" que se necesita para el conocimiento racional. No procede
del conocimiento, es un supuesto previo que lo hace posible.
iv) escptica: "La razn por la que la fsica ha dejado de buscar las causas es que en realidad no existen. La
Ley de causalidad como mucho de lo que se da por bueno entre los filsofos, es una reliquia de una poca
pasada que sobrevive, como la monarqua, porque se supone errneamente que no hace ningn dao". B.
Russell.
3 Elementos de la relacin causal
1 Elemento inicial (A) o causa: su definicin depende del modelo. Pueden ser causas:
a) Acciones intencionales (p.e. administracin de un tratamiento): las ms claras
b) Acciones no intencionales: acciones naturales (lluvia), hechos (fumar),...
c) Atributos (sexo), constructos (inteligencia): como no se definen en funcin de cambios, a veces en lugar de
causas se habla de determinantes.
2 Elemento final (B) o efecto que se define en trminos de cambio con respecto a:
a) situacin previa
b) lo que hubiera ocurrido si no hubiera ocurrido la causa. Es la que plantea ms problemas en el diseo
experimental: necesidad de control.
3 Relacin entre ambos
a) Algunos autores (Russell) la definen exclusivamente como funcional en el sentido de funcin matemtica.
b) Otros (Galileo, Stuart Mill, Kant) tambin como condicin. La relacin condicional puede ser:
i) Necesaria y suficiente: Si A, entonces B y Si B, entonces A.
ii) Necesaria y no suficiente: Si A, entonces B o no B y Si B, entonces A
iii) No necesaria y suficiente: Si A, entonces B y Si B, entonces A o no A
iv) No necesaria y no suficiente: Si A, entonces B o no B y Si B, entonces A o no A
http://www.hrc.es/bioest/causali.html (1 of 3) [28/12/2002 19:01:45]
El cuarto caso es el ms difcil de establecer por su ambigedad, pero es el ms frecuente en Biologa.

4 Caractersticas de la relacin causal: siguiendo a Hume, pero con un lenguaje ms actual
a) temporalidad: la causa precede al efecto
b) direccin: la relacin va de la causa al efecto
c) asociacin: entendida como cuantificacin de la constancia de la relacin
5 Modelos causales en Biologa
1 Modelo de Koch-Henle (sugerido por Koch a propsito de la tuberculosis y paradigmtico en el estudio de
enfermedades infecciosas): ms que un modelo es un conjunto de reglas de decisin que asumen los
principios anteriores:
i) el microorganismo debe encontrarse siempre en los casos de enfermedad.
ii) el microorganismo deber poder ser aislado en cultivo, demostrando ser una estructura viva y distinta de
otras que pueden encontrarse en otras enfermedades.
iii) el microorganismo debe distribuirse de acuerdo con las lesiones y ellas deben explicar las manifestaciones
de la enfermedad.
iv) el microorganismo cultivado (algunas generaciones) deber ser capaz de producir la enfermedad en el
animal de experimentacin.
2 Modelo de Bradford Hill: ms conocido como criterios de Bradford Hill, aunque estrictamente no son
criterios, y paradigmtico en el estudio de enfermedades no infecciosas y tambin asume los principios
anteriores adecuados a la relacin causal tipo iv:
i) fuerza de la asociacin, medida con los ndices estadsticos apropiados.
ii) consistencia entre distintos observadores, en diferentes lugares, tiempos y circunstancias.
iii) especificidad de las causas.
iv) temporalidad
v) gradiente biolgico en la relacin dosis-respuesta.
vi) plausibilidad biolgica.
vii) coherencia con otros conocimientos.
viii) evidencia experimental
ix) analoga con otras relaciones causales
3 Modelo de Rothman, con ms contenido terico, contempla las relaciones multicausales, fue desarrollado
en el mbito de la epidemiologa y es el ms adaptado a los mtodos estadsticos multivariantes.
Define causa como todo acontecimiento, condicin o caracterstica que juega un papel esencial en producir
un efecto (p.e. una enfermedad)
Distingue entre:
Causa componente causa que contribuye a formar un conglomerado que constituir una causa suficiente.
Causa suficiente conjunto de causas que producen un efecto.
Causa necesaria ver ms adelante (punto iii)
Caractersticas del modelo:
i) Ninguna de la causas componentes es superflua
ii) No exige especificidad: un mismo efecto puede ser producido por distintas causas suficientes
iii) Una causa componente puede formar parte de ms de una causa suficiente para el mismo efecto. Si una
causa componente forma parte de todas las causas suficientes de un efecto se la denomina causa necesaria
iv) Una misma causa componente puede formar parte de distintas causas suficientes de distintos efectos
v) Dos causas componentes de una causa suficiente se considera que tienen una interaccin biolgica, es
decir ninguna acta por su cuenta. El grado de interaccin puede depender de otras causas componentes.
Introduccin al anlisis multivariante
Introduccin al anlisis multivariante

qu es?
qu aade?
es siempre necesario?
Volvamos al problema del ejercicio y la supervivencia al infarto. Supongamos que:
1) El problema tiene inters
2) el RR de 1,32 es suficientemente preciso
3) es clnicamente relevante.
Lo aceptamos? Es decir consideramos la asociacin estadstica establecida y pasamos a
considerar si es causal?
Supongamos que si tenemos en cuenta el tabaco, resultara que el 99% de los que hacen
ejercicio no fuman, mientras que slo no fuman el 70% de los que no lo hacen y el tabaco ya
hubiera demostrado una asociacin con la supervivencia: hemos encontrado un nuevo factor
pronstico o slo estamos viendo indirectamente el efecto del tabaco? Dicho en la jerga usual:
es el tabaco una variable de confusin para la asociacin entre el ejercicio y la
supervivencia?
Una variable es de confusin cuando est asociada simultneamente con la variable en
estudio (el ejercicio en este caso) y con la variable respuesta (la supervivencia) y no forma
parte de la cadena causal.
La confusin se puede abordar por:
i) diseo: en este ejemplo se podra hacer que en la muestra estuvieran igualmente
representados los fumadores y los no fumadores. Este es el objetivo fundamental de la
asignacin aleatoria a los grupos en los ensayos clnicos.
ii) anlisis: por anlisis multivariante (los ms comunes son los modelos de regresin) con los
que se puede analizar simultneamente el efecto de varias variables y obtener estimaciones
del efecto de cada una corregido o ajustado por las otras.
Cundo es necesario el anlisis multivariante? Siempre que el diseo no controle la
confusin ... y eso cundo ocurre? No se puede saber a priori: el mejor mtodo para evitar
confusin es la seleccin aleatoria, pero no lo garantiza.
http://www.hrc.es/bioest/multivariante.html [28/12/2002 19:02:29]
Anlisis de la varianza
ANLISIS DE LA VARIANZA
V. Abraira
Bibliografa:
V. Abraira, A. Prez de Vargas
Mtodos Multivariantes en Bioestadstica.
Ed. Centro de Estudios Ramn Areces. 1996.
El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para
comparar dos o ms medias, que es necesario porque cuando se quiere
comparar ms de dos medias es incorrecto utilizar repetidamente el contraste
basado en la t de Student. por dos motivos:
En primer lugar, y como se realizaran simultnea e independientemente varios
contrastes de hiptesis, la probabilidad de encontrar alguno significativo por azar
aumentara. En cada contraste se rechaza la H0 si la t supera el nivel crtico,
para lo que, en la hiptesis nula, hay una probabilidad . Si se realizan m
contrastes independientes, la probabilidad de que, en la hiptesis nula, ningn
estadstico supere el valor crtico es (1 - )m, por lo tanto, la probabilidad de que
alguno lo supere es 1 - (1 - )m, que para valores de prximos a 0 es
aproximadamente igual a m. Una primera solucin, denominada mtodo de
Bonferroni, consiste en bajar el valor de , usando en su lugar /m, aunque
resulta un mtodo muy conservador.
Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras
provienen de la misma poblacin, por lo tanto, cuando se hayan realizado todas
las comparaciones, la hiptesis nula es que todas las muestras provienen de la
misma poblacin y, sin embargo, para cada comparacin, la estimacin de la
varianza necesaria para el contraste es distinta, pues se ha hecho en base a
muestras distintas.
El mtodo que resuelve ambos problemas es el anova, aunque es algo ms que
esto: es un mtodo que permite comparar varias medias en diversas
situaciones; muy ligado, por tanto, al diseo de experimentos y, de alguna
manera, es la base del anlisis multivariante.
http://www.hrc.es/bioest/Anova_1.html [28/12/2002 19:03:14]
Bases del anlisis de la varianza

Supnganse k muestras aleatorias independientes, de tamao n, extradas de
una nica poblacin normal. A partir de ellas existen dos maneras
independientes de estimar la varianza de la poblacin 2:
1) Una llamada varianza dentro de los grupos (ya que slo contribuye a ella la
varianza dentro de las muestras), o varianza de error, o cuadrados medios del
error, y habitualmente representada por MSE (Mean Square Error) o MSW
(Mean Square Within) que se calcula como la media de las k varianzas
muestrales (cada varianza muestral es un estimador centrado de 2 y la media
de k estimadores centrados es tambin un estimador centrado y ms eficiente
que todos ellos). MSE es un cociente: al numerador se le llama suma de
cuadrados del error y se representa por SSE y al denominador grados de
libertad por ser los trminos independientes de la suma de cuadrados.
2) Otra llamada varianza entre grupos (slo contribuye a ella la varianza entre
las distintas muestras), o varianza de los tratamientos, o cuadrados medios de
los tratamientos y representada por MSA o MSB (Mean Square Between). Se
calcula a partir de la varianza de las medias muestrales y es tambin un
cociente; al numerador se le llama suma de cuadrados de los tratamientos (se le
representa por SSA) y al denominador (k-1) grados de libertad.
MSA y MSE, estiman la varianza poblacional en la hiptesis de que las k
muestras provengan de la misma poblacin. La distribucin muestral del
cociente de dos estimaciones independientes de la varianza de una poblacin
normal es una F con los grados de libertad correspondientes al numerador y
denominador respectivamente, por lo tanto se puede contrastar dicha hiptesis
usando esa distribucin.
Si en base a este contraste se rechaza la hiptesis de que MSE y MSA estimen
la misma varianza, se puede rechazar la hiptesis de que las k medias
provengan de una misma poblacin.
Aceptando que las muestras provengan de poblaciones con la misma varianza,
este rechazo implica que las medias poblacionales son distintas, de modo que
con un nico contraste se contrasta la igualdad de k medias.
Existe una tercera manera de estimar la varianza de la poblacin, aunque no es
independiente de las anteriores. Si se consideran las kn observaciones como
una nica muestra, su varianza muestral tambin es un estimador centrado de
2:
Se suele representar por MST, se le denomina varianza total o cuadrados
medios totales, es tambin un cociente y al numerador se le llama suma de
http://www.hrc.es/bioest/Anova_2.html (1 of 2) [28/12/2002 19:04:11]
cuadrados total y se representa por SST, y el denominador (kn -1) grados de

libertad.
Los resultados de un anova se suelen representar en una tabla como la
siguiente:
Fuente de variacin
Entre grupos
Tratamientos
Dentro
Error
Total
G.L.
SS
MS
k-1
SSA
SSA/(k-1)
MSA/MSE
(n-1)k
SSE
SSE/k(n-1)
kn-1
SST
Y el cociente F se usa para realizar el contraste de la hiptesis de medias

iguales. La regin crtica para dicho contraste es F > F(k-1,(n-1)k)
Algunasd propiedades de la tabla de anova
Algunas propiedades
Es fcil ver en la tabla anterior que
GLerror+ GLtrata = (n - 1) k + k - 1 = nk - k + k - 1 = nk - 1 = GLtotal
No es tan inmediato, pero las sumas de cuadrados cumplen la misma
propiedad, llamada identidad o propiedad aditiva de la suma de cuadrados:
SST = SSA + SSE

El anlisis de la varianza se puede realizar con tamaos muestrales iguales o
distintos, sin embargo es recomendable iguales tamaos por dos motivos:
1)
La F es insensible a pequeas variaciones en la asuncin de igual
varianza, si el tamao es igual.
2)
Igual tamao minimiza la probabilidad de error tipo II.
Ejemplo de anova
Ejemplo 1
Se quiere evaluar la eficacia de distintas dosis de un frmaco contra la
hipertensin arterial, comparndola con la de una dieta sin sal. Para ello
se seleccionan al azar 25 hipertensos y se distribuyen aleatoriamente en
5 grupos. Al primero de ellos no se le suministra ningn tratamiento, al
segundo una dieta con un contenido pobre en sal, al tercero una dieta sin
sal, al cuarto el frmaco a una dosis determinada y al quinto el mismo
frmaco a otra dosis. Las presiones arteriales sistlicas de los 25 sujetos
al finalizar los tratamientos son:
Grupo
1
180
172
163
158
147
173
158
170
146
152
175
167
158
160
143
182
160
162
171
155
181
175
170
155
160
La tabla de anova es:

GL
SS
MS
Tratamiento
2010,64
502,66
11,24
Error
20
894,4
44,72
Total
24
2905,04
Fuente de variacin
Como F0,05(4,20) =2,87 y 11,24>2,87 rechazamos la hiptesis nula y concluimos

que los resultados de los tratamientos son diferentes.
Nota: Para hacerlo con un paquete estadstico, p.e. el SPSS, deberamos crear
un archivo con 2 variables: Trata (con un cdigo distinto para cada grupo, p.e.
de 1 a 5) y Presion con la presin arterial de cada individuo al acabar el estudio.
Para calcular el Anova desplegamos los mens que se ven en la grfica:
Ejemplo de anova
La tabla de anova que devuelve el programa es
que incluye tambin el valor p asociado al contraste.
Pruebas para la homocesdasticidad
Pruebas para la homocedasticidad

Para que este contraste de hiptesis, basado en la F, lo sea de la igualdad de
medias es necesario que todas las muestras provengan de una poblacin con la
misma varianza (2), de la que MSE y MSA son estimadores. Por lo tanto es
necesario comprobarlo antes de realizar el contraste. Del mismo modo que no
se puede usar repetidamente la prueba basada en la en la t para comparar ms
de dos medias, tampoco se puede usar la prueba basada en la F para comparar
ms de dos varianzas. La prueba ms usada para contrastar si varias muestras
son homocedsticas (tiene la misma varianza) es la prueba de Bartlett.
La prueba se basa en que, en la hiptesis nula de igualdad de varianzas y
poblaciones normales, un estadstico calculado a partir de las varianzas
muestrales y MSE sigue una distribucin
Otras pruebas para contrastar la homocedasticidad de varias muestras son la de
Cochran y la de la F del cociente mximo, ambas similares y de clculo ms
sencillo pero restringidas al caso de iguales tamaos muestrales. La de Cochran
es particularmente til para detectar si una varianza es mucho mayor que las
otras
En el caso de que las muestras no sean homocedsticas, no se puede, en
principio, realizar el anlisis de la varianza.
Existen, sin embargo, soluciones alternativas: Sokal y Rohlf describen una
prueba aproximada, basada en unas modificaciones de las frmulas originales.
Hay situaciones en que la heterocedasticidad es debida a falta de normalidad.
En estos casos existen transformaciones de los datos que estabilizan la
varianza: la raz cuadrada en el caso de Poisson, el arco seno de la raz
cuadrada de p para la binomial, el logaritmo cuando la desviacin estndar es
proporcional a la media.
En la prctica, si las pruebas de homocedasticidad obligan a rechazar la
hiptesis nula, se prueba si con alguna de estas transformaciones los datos son
homocedsticos, en cuyo caso se realiza el anova con los datos transformados.
Hay que tener en cuenta que estas pruebas van "al reves" de lo habitual. La
hiptesis nula es lo que se quiere probar, en consecuencia hay que usarlas con
precaucin.
Modelos de anlisis de la varianza
Modelos de anlisis de la varianza

El anova permite distinguir dos modelos para la hiptesis alternativa:
modelo I o de efectos fijos en el que la H1 supone que las k muestras son
muestras de k poblaciones distintas y fijas.
modelo II o de efectos aleatorios en el que se supone que las k muestras, se
han seleccionado aleatoriamente de un conjunto de m>k poblaciones.
Un ejemplo de modelo I de anova es el Ejemplo 1, porque en l se asume que
existen cinco poblaciones (sin tratamiento, con poca sal, sin sal, etc.) fijas, de
las que se han extrado las muestras.
Un ejemplo de modelo II sera: un investigador est interesado en determinar el
contenido, y sus variaciones, de grasas en las clulas hepticas de cobayas;
toma del animalario 5 cobayas al azar y les realiza, a cada una, 3 biopsias
hepticas.
La manera ms sencilla de distinguir entre ambos modelos es pensar que, si se
repitiera el estudio un tiempo despus, en un modelo I las muestras seran
iguales (no los individuos que las forman) es decir corresponderan a la misma
situacin, mientras que en un modelo II las muestras seran distintas.
Aunque las asunciones iniciales y los propsitos de ambos modelos son
diferentes, los clculos y las pruebas de significacin son los mismos y slo
difieren en la interpretacin y en algunas pruebas de hiptesis suplementarias.
Modelo I de anlisis de la varianza
Modelo I o de efectos fijos

Un valor individual se puede escribir en este modelo como
es la media global, i es la constante del efecto, o efecto fijo, que diferencia a

las k poblaciones. Tambin se puede escribir:
representa la desviacin de la observacin j-sima de la muestra i-sima,
con respecto a su media. A este trmino se le suele llamar error aleatorio y,
teniendo en cuenta las asunciones iniciales del anlisis de la varianza son k
variables (una para cada muestra), todas con una distribucin normal de media
0 y varianza 2.
La hiptesis nula en este anlisis es que todas las medias son iguales
que puede escribirse en trminos del modelo como:
Como en H0 se cumplen las condiciones del apartado anterior se tratar de ver

como se modifican las estimaciones de la varianza en H1.
En H0 MSA y MSE son estimadores centrados de 2, es decir y usando el
superndice 0 para indicar el valor de las variables en H0
E[MSA0] = 2
E[MSE0] = 2
Se puede ver que MSE es igual en la hiptesis nula que en la alternativa. Por lo
tanto:
E[MSE] = E[MSE0] = 2
Sin embargo al valor esperado de MSA en la hiptesis alternativa se le aade un
trmino con respecto a su valor en la hiptesis nula
Al segundo sumando dividido por n se le llama componente de la varianza

aadida por el tratamiento, ya que tiene forma de varianza, aunque
Modelo I de anlisis de la varianza
estrictamente no lo sea pues i no es una variable aleatoria.

La situacin, por lo tanto, es la siguiente: en H0, MSA y MSE estiman 2; en H1,
. Contrastar la H0 es equivalente a
MSE estima 2 pero MSA estima
contrastar la existencia de la componente aadida o, lo que es lo mismo, que
MSE y MSA estimen, o no, la misma varianza.
El estadstico de contraste es F=MSA/MSE que, en la hiptesis nula, se
distribuye segn una F con k - 1 y (n - 1)k grados de libertad. En caso de
rechazar la H0, MSA - MSE estima
Modelo II de anlisis de la varianza
Modelo II o de efectos aleatorios

En este modelo se asume que las k muestras son muestras aleatorias de k
situaciones distintas y aleatorias. De modo que un valor aislado Yij se puede
escribir como:
donde es la media global, ij son variables (una para cada muestra)

distribuidas normalmente, con media 0 y varianza 2 (como en el modelo I) y A
es una variable distribuida normalmente, independiente de las ij, con media 0 y

varianza
La diferencia con respecto al modelo I es que en lugar de los efectos fijos i

ahora se consideran efectos aleatorios Ai.
Igual que en el modelo I se encuentra que MSE no se modifica en la H1 y que al
valor esperado de MSA se le aade el trmino de componente aadida (que
aqu es una verdadera varianza ya que Ai es una variable aleatoria):
Para llegar a este resultado se utiliza la asuncin de independencia entre Ai y ij

y es, por tanto, muy importante en el modelo y conviene verificar si es correcta
en cada caso. En el ejemplo de las cobayas significara que las variaciones de
grasa en el hgado de cada cobaya son independientes de las variaciones entre
cobayas. Esta asuncin se violara si, por ejemplo, en el animalario existieran 2
cepas genticas tales que en una de ellas la concentracin de grasa en las
clulas hepticas fuera mayor y ms variable que en la otra.
Por tanto, en H0 tanto MSA como MSE estiman 2, mientras que en H1, MSE
. La existencia de esta componente
sigue estimando 2 y MSA estima
aadida se contrasta con F=MSA/MSE y en caso afirmativo, la varianza de Ai se
estima como:
Pruebas "a posteriori"
Pruebas a posteriori
En general, en un modelo II el inters del investigador es averiguar si existe
componente aadida y en su caso estimarla.
Sin embargo, en un modelo I, lo que tiene inters son las diferencias entre los
distintos grupos.
En el Ejemplo 1, lo que interesa, una vez visto que la presin arterial media es
diferente para los cinco grupos, es, por ejemplo, estimar el efecto de la dieta sin
sal, 3 1, o el aumento del efecto de la segunda dosis del frmaco con
respecto a la primera dosis 5 4.
Las pruebas "a posteriori" son un conjunto de pruebas para probar todas las
posibles hiptesis del tipo i j = 0.
Existen varias, (Duncan, Newman-Keuls, LSD): todas ellas muy parecidas. Usan
el rango (diferencia entre medias) de todos los pares de muestras como
estadstico y dicho rango debe superar un cierto valor llamado mnimo rango
significativo para considerar la diferencia significativa.
La principal diferencia con respecto a la t de Student radica en que usan MSE
como estimador de la varianza, es decir un estimador basado en todas las
muestras.
Una manera semigrfica habitual de representar los resultados es dibujar una
lnea que una cada subconjunto de medias adyacentes entre las que no haya
diferencias significativas.
Para los datos del Ejemplo 1 la salida semigrfica para la prueba LSD de, por
ejemplo, el Statgraphics es
Pruebas "a posteriori"
que se interpreta como:

Los grupos 5 y 4 estn unidos por una lnea vertical de X por tanto sus medias
no son diferentes entre s y lo mismo los grupos 4, 3 y 2, mientras que la media
del grupo 1 es distinta de la de todos los dems.
Anlisis de la varianza de dos vas
Anlisis de la varianza de dos factores

Es un diseo de anova que permite estudiar simultneamente los efectos de dos
fuentes de variacin.
En el ejemplo 1, en el que se estudiaban diversos tratamientos para la hipertensin
arterial, se podra plantear que, quizs, la evolucin de la misma fuera diferente
para los hombres y las mujeres, en cuyo caso, y si el nmero de hombres y
mujeres en cada muestra no fuera el mismo, podra ocurrir que una parte del efecto
atribuido a los tratamientos fuera debido al sexo.
En cualquier caso, el investigador puede estar interesado en estudiar si hay, o no,
diferencia en la evolucin segn el sexo. En un anova de dos vas se clasifica a los
individuos de acuerdo a dos factores (o vas) para estudiar simultneamente sus
efectos. En este ejemplo se haran cinco grupos de tratamiento para los hombres y
otros cinco para las mujeres, en total diez grupos; en general, si el primer factor
tiene a niveles y el segundo tiene b, se tendrn ab muestras o unidades
experimentales, cada una con n individuos o repeticiones.
Una observacin individual se representa como:
El primer subndice indica el nivel del primer factor, el segundo el nivel del segundo
factor y el tercero la observacin dentro de la muestra. Los factores pueden ser
ambos de efectos fijos (se habla entonces de modelo I), de efectos aleatorios
(modelo II) o uno de efectos fijos y el otro de efectos aleatorios (modelo mixto). El
modelo matemtico de este anlisis es:
modelo I
modelo II
modelo mixto
donde es la media global, i o Ai el efecto del nivel i del 1 factor, j o Bj el efecto
del nivel j del 2 factor y ijk las desviaciones aleatorias alrededor de las medias,
que tambin se asume que estn normalmente distribuidas, son independientes y
tienen media 0 y varianza 2.
A las condiciones de muestreo aleatorio, normalidad e independencia, este modelo
aade la de aditividad de los efectos de los factores.
A los trminos ()ij, (AB)ij, (B)ij, se les denomina interaccin entre ambos factores
y representan el hecho de que el efecto de un determinado nivel de un factor sea

diferente para cada nivel del otro factor.
Para entender mejor este concepto de interaccin veamos un ejemplo sencillo
sobre un anova de dos factores, cada uno con dos niveles: supngase un estudio
para analizar el efecto de un somnfero teniendo en cuenta el sexo de los sujetos.
Se eligen al azar dos grupos de hombres y otros dos de mujeres. A un grupo de
hombres y otro de mujeres se les suministra un placebo y a los otros grupos el
somnfero. Se mide el efecto por el tiempo que los sujetos tardan en dormirse desde
el suministro de la pldora.
Se trata de un anova de dos factores (sexo y frmaco) fijos, cada uno con dos
niveles (hombre y mujer para el sexo y somnfero y placebo para el frmaco). Los
dos tipos de resultados posibles se esquematizan en la figura
En la figura A se observa que las mujeres tardan ms en dormirse, tanto en el grupo

tratado como en el grupo placebo (hay un efecto del sexo) y que los tratados con
placebo tardan ms en dormirse que los tratados con somnfero en ambos sexos
(hay un efecto del tratamiento). Ambos efectos son fcilmente observables.
Sin embargo en la figura B es difcil cuantificar el efecto del somnfero pues es
distinto en ambos sexos y, simtricamente, es difcil cuantificar el efecto del sexo
pues es distinto en ambos grupos de tratamiento. En este caso, se dice que existe
interaccin.
Podra, incluso, darse el caso de que se invirtieran los efectos de un factor para los
distintos niveles del otro, es decir, que las mujeres se durmieran antes con el
somnfero y los hombres antes con el placebo.
La interaccin indica, por tanto, que los efectos de ambos factores no son aditivos:
cuando se dan juntos, su efecto no es la suma de los efectos que tienen cuando
estn por separado, por lo que, si en un determinado estudio se encuentra
interaccin entre dos factores, no tiene sentido estimar los efectos de los
factores por separado. A la interaccin positiva, es decir, cuando el efecto de los
factores actuando juntos es mayor que la suma de efectos actuando por separado,
en Biologa se le denomina sinergia o potenciacin y a la interaccin negativa
inhibicin. En el ejemplo de la figura B, se dira que el ser mujer inhibe el efecto del
somnfero, o que el ser hombre lo potencia (segn el sexo que se tome como
referencia).
Identidad de la suma de cuadrados

La suma de cuadrados total en un anova de 2 vas, es:
(donde para representar las medias se ha usado la convencin habitual de

poner un punto (.) en el lugar del subndice con respecto al que se ha sumado)
que dividida por sus grados de libertad, abn - 1, estima la varianza 2 en el
supuesto de que las ab muestras provengan de una nica poblacin.
Se puede demostrar que
que es la llamada identidad de la suma de cuadrados en un anova de dos

factores. Los sucesivos sumandos reciben respectivamente el nombre de suma
de cuadrados del 1 factor (tiene a -1 grados de libertad y recoge la variabilidad
de los datos debida exclusivamente al 1 factor), del 2 factor (con b -1 grados
de libertad y recoge la variabilidad de los datos debida exclusivamente al 2
factor), de la interaccin (con (a - 1)(b - 1) grados de libertad, recoge la
variabilidad debida a la interaccin) y del error (con ab(n - 1) grados de libertad,
recoge la variabilidad de los datos alrededor de las medias de cada muestra).
Los resultados de un anlisis de la varianza de dos factores se suelen
representar en una tabla como la siguiente:
Fuente de variacin
GL
SS
MS
1 factor
a -1
SSA
SSA/(a - 1)
2 factor
b-1
SSB
SSB/(b - 1)
(a - 1)(b - 1)
SSAB
SSAB/[(a - 1)(b - 1)]
Error
ab(n - 1)
SSE
SSE/[ab(n - 1)]
Total
abn - 1
SST
Interaccin
Los grados de libertad tambin son aditivos.

En ocasiones se aade una primera lnea llamada de tratamiento o de
subgrupos cuyos grados de libertad y suma de cuadrados son las sumas de los
del primer, segundo factor y la interaccin, que corresponderan a la suma de
cuadrados y grados de libertad del tratamiento de un anlisis de una va en que
las ab muestras se considerarn como muestras de una clasificacin nica.
Para plantear los contrastes de hiptesis hay que calcular los valores esperados de
los distintos cuadrados medios.
Contrastes de hiptesis en anova de 2 vas
Contrates de hiptesis en un anlisis de

la varianza de dos factores
Del mismo modo que se hizo en el anova de una va, para plantear los contrastes
de hiptesis habr que calcular los valores esperados de los distintos cuadrados
medios. Los resultados son:
Modelo I
MS
Valor esperado
MSA
MSB
MSAB
MSE
Por lo tanto, los estadsticos MSAB/MSE, MSA/MSE y MSB/MSE se distribuyen
como una F con los grados de libertad correspondientes y permiten contrastar,
respectivamente, las hiptesis:
i) no existe interaccin (MSAB/MSE)
ii) no existe efecto del primer factor, es decir, diferencias entre niveles del primer
factor (MSA/MSE)
iii) no existe efecto del segundo factor (MSB/MSE)
Contrastes de hiptesis en anova de 2 vas
Si se rechaza la primera hiptesis de no interaccin, no tiene sentido contrastar

las siguientes. En este caso lo que est indicado es realizar un anlisis de una
va entre las ab combinaciones de tratamientos para encontrar la mejor
combinacin de los mismos.
Contrastes de hiptesis en un anova de 2 vas modelo II
Contraste de hiptesis en un anova de 2

vas
Modelo II
MS
Valor esperado
MSA
MSB
MSAB
MSE
donde
son, respectivamente las componentes aadidas por el
primer factor, por el segundo y por la interaccin, que tienen la misma forma que
los del modelo I, sin ms que cambiar i y j por Ai y Bj, respectivamente.
La interaccin se contrasta, como en el modelo I, con MSAB/MSE, si se rechaza
la hiptesis nula se contrastaran cada uno de los factores con MSA/MSAB y
MSB/MSAB.
En un modelo II, como no se est interesado en estimar los efectos de los
factores sino slo la existencia de la componente aadida, s tiene sentido
contrastar la existencia de la misma para cada factor incluso aunque exista
interaccin.
Aqu el problema se plantea cuando no se puede rechazar la hiptesis nula y se
concluye que no existe interaccin: entonces tanto MSE como MSAB estiman
2, entonces cul se elige para contrastar la componente aadida de los
factores?
En principio, parece razonable escoger su media (la media de varios
estimadores centrados es tambin un estimador centrado y ms eficiente), sin
embargo si se elige MSAB se independiza el contraste para los factores de un
posible error tipo II en el contraste para la interaccin. Hay autores que por ello
opinan que es mejor usar MSAB, pero otros proponen promediar si se puede
asegurar baja la probabilidad para el error tipo II. La media de los cuadrados
medios se calcula dividiendo la suma de las sumas de cuadrados por la suma
de los grados de libertad.
Ejemplo
A partir de la siguiente tabla de un anova de 2 factores modelo II, realizar los
contrastes adecuados.
Fuente de
variacin
G.L.
SS
MS
1 factor
315,8
78,95
2 factor
823,5
274,5
Interaccin
12
328,9
27,41
Error
100
2308,0
23,08
Total
119
3776,2
Se empezara contrastando la existencia de interaccin: f = 27,41/23,08 = 1,188

como F0,05(12,100) = 1,849 no se puede, al nivel de significacin del 95%,
rechazar la hiptesis nula y se concluye que no existe interaccin.
Si usamos MSAB para contrastar los factores:
1 factor: f = 78,95/27,41 = 2,880 como F0,05(4,12) = 3,26 no se rechaza la
hiptesis nula y se concluye la no existencia de componente aadida por este
factor.
2 factor: f = 274,5/27,41 = 10,015 como F0,05(3,12) = 3,49 se rechaza la
hiptesis nula y se acepta la existencia de componente aadida por este factor.
El resultado del anlisis es: no existe componente aadida por la interaccin,
tampoco por el 1 factor y s existe componente aadida por el 2.
La estimacin de esta componente es: como a partir de los grados de libertad de
la tabla podemos calcular a = 5, b = 4 y n = 6 resulta que la estimacin de
es 274,5 - 27,41 = 247,09; por lo tanto
que
representa un 35,7% de componente aadida por el segundo factor.
Si se hubiera optado por promediar, los cuadrados medios promediados son
(328,9+2308,0)/(12+100)=
23,54 con 112 grados de libertad y hubiera resultado significativo tambin el 1
factor.
La salida de un paquete estadstico, p.e. el Statgraphics, para un anova de 2

factores modelo II
Contrastes de hiptesis en un anova de 2 vas (modelo mixto)
Contrastes de hiptesis en un anova de

dos vas
Modelo mixto
Supngase el primer factor de efectos fijos y el segundo de efectos aleatorios, lo

que no supone ninguna perdida de generalidad, ya que el orden de los factores es
arbitrario.
MS
Valor esperado
MSA
MSB
MSAB
MSE
Se contrastan la interaccin y el factor aleatorio con el trmino de error, si la

interaccin fuera significativa no tiene sentido contrastar el efecto fijo y si no lo
fuera, el efecto fijo se contrasta con el trmino de interaccin o con el promedio
de interaccin y error.
Ejemplo
Ejemplo
Se quiere probar la eficacia de un somnfero estudiando posibles diferencias de
la misma por el sexo de los sujetos. Se eligen al azar dos grupos de insomnes
varones y otros dos de mujeres y tanto para los hombres como para las mujeres
se suministra a un grupo el somnfero y a otro un placebo y se mide, en minutos,
el tiempo que tardan en dormirse.
Los resultados son:
Placebo Somnfero
30
35
50
32
45
30
47
25
38
30
50
42
35
30
46
15
25
18
32
23
Hombre
Mujer
Se trata de un anova de dos factores fijos. Llamamos primer factor a la droga

que tiene dos niveles: placebo y somnfero. El segundo factor es el sexo
tambin con 2 niveles: hombres y mujeres. El tamao de las muestras es n=5.
La tabla de anova es:
Fuente de
variacin
GL
SS
MS
Somnfero
696,2
696,2
Sexo
105,8
105,8
Interaccin
0,2
0,2
Error
16 1197,6
74,85
Total
19 1999,8
Se empieza contrastando la interaccin: f = 0,2/74,85 = 0,0026 que como es

menor que F0,05(1,16)=4,49 no se rechaza la hiptesis nula de que no existe
interaccin.
A continuacin se contrastan los factores: para el somnfero f = 696,2/74,85 =
9,3 que es mayor que 4,49 por lo tanto existe efecto del somnfero y para el
Ejemplo
sexo f = 105,8/74,85 = 1,41 que como es menor que 4,49 no existe diferencias
entre los sexos.
La estimacin del efecto del somnfero ser la diferencia entre las medias de los
que lo toman y los que tomaron placebo, sin tener en cuenta el sexo, una vez
que se ha visto que no tiene efecto.
Para analizarlo con un paquete estadstico, p.e. el Statgraphics, se necesita crear

un archivo con tres variables
y el resultado, pidiendo la tabla de anova
Ejemplo
y la tabla de medias
Por tanto la estimacin del efecto del somnifero es 39,8 - 28,0=11,8 min
Tamaos muestrales desiguales en un anova de dos factores
Tamaos muestrales desiguales en un anova de dos factores

Aunque los paquetes estadsticos suelen hacer el anova de dos factores, tanto
en el caso de tamaos muestrales iguales como desiguales, conviene resaltar
que el anlisis es bastante ms complicado en el caso de tamaos desiguales.
La complicacin se debe a que con tamaos desiguales hay que ponderar las
sumas de cuadrados de los factores con los tamaos muestrales y no resultan
ortogonales (su suma no es la suma de cuadrados total) lo que complica no slo
los clculos sino tambin los contrastes de hiptesis.
Por esto, cuando se disea un anlisis factorial de la varianza se recomienda
disearlo con tamaos iguales. Hay ocasiones en que, sin embargo, por la
dificultad de obtener los datos o por prdida de alguno de ellos es inevitable
recurrir al anlisis con tamaos desiguales. Algunos autores recomiendan,
incluso, renunciar a alguno de los datos para conseguir que todas las muestras
tengan el mismo tamao. Evidentemente esta solucin es delicada pues podra
afectar a la aleatoriedad de las muestras.
Casos particulares de anova
Casos particulares: Anova de dos factores sin repeticin

En ciertos estudios en que los datos son difciles de obtener o presentan muy
poca variabilidad dentro de cada subgrupo es posible plantearse un anova sin
repeticin, es decir, en el que en cada muestra slo hay una observacin (n=1).
Hay que tener en cuenta que, como era de esperar con este diseo, no se
puede calcular SSE. El trmino de interaccin recibe el nombre de residuo y
que, como no se puede calcular MSE, no se puede contrastar la hiptesis de
existencia de interaccin.
Esto ltimo implica tambin que:
a) en un modelo I, para poder contrastar las hiptesis de existencia de efectos
de los factores no debe haber interaccin (si hubiera interaccin no tenemos
trmino adecuado para realizar el contraste).
b) en un modelo mixto existe el mismo problema para el factor fijo.
Bloques completos aleatorios
Otro diseo muy frecuente de anova es el denominado de bloques completos
aleatorios diseado inicialmente para experimentos agrcolas pero actualmente
muy extendido en otros campos. Puede considerarse como un caso particular
de un anova de dos factores sin repeticin o como una extensin al caso de k
muestras de la comparacin de medias de dos muestras emparejadas. Se trata
de comparar k muestras emparejadas con respecto a otra variable cuyos efectos
se quieren eliminar.
Por ejemplo, en un ensayo clnico para comparar los efectos de dos analgsicos
y un placebo en el que el efecto se mide por el tiempo que tarda en desaparecer
una cefalea. Si se hicieran tres grupos de enfermos y a cada uno de ellos se le
suministrara un tratamiento distinto, habra una gran variacin individual en las
respuestas, debido a que no todas las cefaleas son de la misma intensidad y no
todos los individuos tienen la misma percepcin del dolor, que dificultara el
hallazgo de diferencias entre los tratamientos. Esta dificultad desaparece si se
aplican los tres tratamientos a los mismos individuos en diferentes episodios de
cefalea. Se ha emparejado a cada individuo consigo mismo, con lo que se
elimina la variacin individual.
En este diseo a los datos de cada individuo se les denomina bloque y los datos
se representan en una tabla de doble entrada anloga a la del anova de
clasificacin nica en la que las a columnas son los tratamientos y las b filas los
bloques, el elemento Yij de la tabla corresponde al tratamiento i y al bloque j. Las
hiptesis que se pueden plantear son:
(igualdad
de medias de tratamientos)
Casos particulares de anova
y tambin, aunque generalmente tiene menos inters:

(igualdad
de medias de bloques)
A pesar del parecido con la clasificacin nica, el diseo es diferente: all las
columnas eran muestras independientes y aqu no. Realmente es un diseo de
dos factores, uno de efectos fijos: los tratamientos, y el otro de efectos
aleatorios: los bloques, y sin repeticin: para cada bloque y tratamiento slo hay
una muestra.
El modelo aqu es:
donde i es el efecto del tratamiento i y Bj el del bloque j. No hay trmino de

interaccin ya que, al no poder contrastar su existencia no tiene inters. Al ser
un modelo mixto exige la asuncin de no existencia de interaccin y los
contrastes se hacen usando el trmino MSE como divisor.
Ejemplo de anova de bloques completos aleatorios
Ejemplo 3
En el ensayo clnico de los analgsicos descrito anteriormente se encuentran los
siguientes resultados:
Placebo
Analgsico A Analgsico B
35
20
22
40
35
42
60
50
30
50
40
35
50
30
22
La tabla de anova correspondiente:

Fuente de variacin
G.L.
SS
MS
Analgsico
(tratamiento)
748,8
374,4
Paciente (bloque)
767,6
191,9
Error
409,2
51,15
Total
14
1925,6
Los contrastes de hiptesis se hacen:

para el analgsico f=374,4/51,15=7,32 que como es mayor que F0,05(2,8)=4,46
existe un efecto del tratamiento.
para los bloques f=191,9/51,15=3,75 que es menor que F0,05(4,8)=3,84 por tanto
no hay componente aadida por los pacientes.
El archivo para analizarlo con en un paquete estadstisco
y el resultado
Anova de ms de dos factores
Anlisis de la varianza de ms de dos factores

Es una generalizacin del de dos factores. El procedimiento, por lo tanto, ser:
1) encontrar el modelo, teniendo en cuenta si los factores son fijos o aleatorios y
todos los trminos de interaccin.
2) subdividir la suma de cuadrados total en tantos trminos ortogonales como
tenga el modelo y estudiar los valores esperados de los cuadrados medios para
encontrar los estadsticos que permitan realizar los contrastes de hiptesis.
Un modelo de tres factores fijos, por ejemplo, ser:
Los tres primeros subndices para los factores y el cuarto para las repeticiones,
ntese que aparecen trminos de interaccin de segundo y tercer orden, en
general en un modelo de k factores aparecen trminos de interaccin de orden
2, 3,... hasta k y el nmero de trminos de interaccin de orden n ser el nmero
combinatorio Ck;n. Este gran nmero de trminos de interaccin dificulta el
anlisis de ms de dos factores, ya que son difciles de interpretar y complican
los valores esperados de los cuadrados medios por lo que tambin resulta difcil
encontrar los estadsticos para los contrastes. Por estas razones no se suele
emplear este tipo de anlisis y cuando interesa estudiar varios factores a la vez
se recurre a otros mtodos de anlisis multivariante.
Correlacion y modelos de regresion lineal
CORRELACION Y MODELOS DE REGRESION LINEAL

V. Abraira
Bibliografa:
D.G. Kleinbaum, L.L. Kupper, K.E. Muller
Applied Regression Analysis and Other Multivariables Methods.
PWS-KENT Publishing Company. 1988.
Generalizacin del concepto de fdp a variables multidimensionales
La funcin densidad de probabilidad (fdp) para una variable aleatoria es una
funcin a partir de la cual se puede calcular la probabilidad de los distintos
valores de la variable.
En el caso discreto:
en el caso continuo:
Esto se puede generalizar a ms de una variable. Para n variables aleatorias X1,

X2, ..., Xn se llama fdp conjunta a una funcin n-dimensional f(x1,x2,...,xn) a partir
de la cual se puede calcular la probabilidad de los distintos valores de las
variables.
En el caso discreto:
en el caso continuo:
Del mismo modo que en el caso unidimensional estas funciones estn

sometidas a las condiciones:
http://www.hrc.es/bioest/Reglin_1.html (1 of 3) [28/12/2002 19:19:23]
discreta
continua
Ejemplo 1: En una cierta poblacin se definen dos variables discretas: X1=

hipertensin arterial y X2= consumo excesivo de sal, ambas con los valores
0=no y 1=s. La fdp conjunta podra ser
X1
X2
0,4
0,1
0,3
0,2
f(0,0)=0,4 quiere decir que la probabilidad de que un individuo no sea hipertenso

(X1=0) y no tenga un consumo excesivo de sal (X2=0) es 0,4. Obsrvese que la
suma de los valores de la fdp es 1.
A partir de esta fdp se puede calcular p.e. la probabilidad de que un individuo
sea hipertenso como 0,1+0,2=0,3.
En general dada una fdp conjunta (para simplificar la notacin consideremos
slo dos variables X e Y) se pueden calcular las denominadas fdp marginales
como
Caso discreto
Caso continuo
y simtricamente para la variable Y.

En el ejemplo anterior:
X1
X2
f2(X2)
0,4
0,1
0,5
0,3
0,2
0,5
f1(X1)
0,7
0,3
Se definen tambin las fdp condicionadas
que permiten calcular las respectivas probabilidades condicionadas.

En el ejemplo anterior se puede construir, p.e., la fdp de la hipertensin (X1)
condicionada al consumo no excesivo de sal (X2=0).
X1
0
0,4/0,5=0,8
0,1/0,5=0,2
Obsrvese que como esto es una fdp, la suma de sus valores debe ser 1.
0,8 es la probabilidad de que un individuo no sea hipertenso dado que no tiene
un consumo excesivo de sal.
Independencia de dos variables aleatorias

Dos v.a. X e Y se dice que son estocsticamente independientes si y slo si
f(x,y)=f1(x).f2(y). En caso contrario se dice que estn correlacionadas.
Son independientes las variables del ejemplo anterior? Como f1(0)=0,7 y
f2(0)=0,5 f1(0). f2(0)=0,35 no es igual a f(0,0)=0,4 no son independientes.
Segn la definicin de fdp condicionada, si X e Y son independientes
que coincide ms con la idea intuitiva de independencia.

Cundo diramos que la hipertensin es independiente del consumo de sal?
Cuando la probabilidad de ser hipertenso es la misma en los consumidores de
sal: f(x1|X2=1), en los no consumidores: f(x1|X2=0) y en la poblacin general:
f1(x1).
En el ejemplo, la probabilidad de ser hipertenso en la poblacin general
f1(1)=0,3 y en los consumidores de sal f(X1=1|X2=1)=0,2/0,5=0,4 por lo tanto
tampoco son independientes desde esta perspectiva (evidentemente, ya que
ambas son equivalentes).
Diramos que el consumo de sal y la hipertensin estn correlacionados o
asociados, o que la hipertensin depende del consumo de sal o, en terminologa
epidemiolgica, que el consumo de sal es un factor de riesgo para la
hipertensin. En cualquier caso, la correlacin no implica dependencia causal.
El problema, en la prctica, es que no se suelen conocer las fdp's. A partir de
una muestra slo se puede obtener una estimacin de la misma, adems
tambin se desean obtener estimaciones de la fuerza de la asociacin.
Los modelos de regresin son modelos matemticos de dependencia entre
variables que permiten resolver ambos problemas. Hay tantos modelos como
funciones matemticas de dependencia se puedan concebir, los ms usados
son lineal, polinmico, logstico, de Poisson, ...
http://www.hrc.es/bioest/Reglin_3.html [28/12/2002 19:20:10]
Modelo lineal
Funcin lineal
Se llama funcin lineal de una
variable, a una funcin de la
forma
0: ordenada en el origen (valor

de Y cuando X=0)
1: pendiente (cambio de Y al
aumentar X en 1)
Modelo de regresin lineal simple

Es un modelo de regresin lineal entre dos variables
es un modelo probabilstico, que tambin se puede escribir
A la variable Y se la denomina variable dependiente y a X independiente.

Modelo I de regresin lineal se asume que
i) X no es una variable aleatoria

ii) para cada valor xi de X existe
una v.a. Y|xi cuya media est
dada por el modelo
iii) todas las variables Y|xi son
normales, independientes y con
igual varianza.
Ejemplo 2: Se quiere estudiar la asociacin entre consumo de sal y tensin arterial.

A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se
mide su tensin arterial un tiempo despus.
Variable X: gr. de sal diarios (no aleatoria)
Variable Y: presin arterial en mm. de Hg
Modelo lineal
asumimos que para cada valor de X, Y no est determinada, sino que sigue una
distribucin normal cuya media est dada por el modelo:
0 presin arterial media de los que no toman nada de sal.

1 cambio de la media de presin arterial por aumentar 1 gr el consumo de sal,
asumiendo que es constante. Si fuera 0, quiere decir que la presin no cambia con
el consumo de sal, por tanto ambas variables son independientes, un valor distinto
de cero indica que estn correlacionadas y su magnitud mide la fuerza de la
asociacin.
A partir de una muestra aleatoria, la teora estadstica permite:
i) estimar los coeficientes i del modelo (hay dos procedimientos: mnimos
cuadrados y mxima verosimilitud que dan el mismo resultado).
ii) estimar la varianza de las variables Y|xi llamada cuadrados medios del error y
representada por s2 o MSE. A su raz cuadrada se le llama error estndar de la
estimacin.
iii) conocer la distribucin muestral de los coeficientes estimados, tanto su forma (t)
como su error estndar, que permite hacer estimacin por intervalos como
contrastes de hiptesis sobre ellos.
Ejemplo 3: Para el diseo del ejemplo 2 una muestra produce los siguientes datos:
X (sal)
Y (Presin)
1,8
100
2,2
98
3,5
110
4,0
110
4,3
112
5,0
120
La "salida" de un paquete estadstico es:
Modelo lineal
86,371 presin arterial media sin nada de sal.

6,335 aumento de presin por cada gr de sal; como es distinto de 0 indica
correlacin. La pregunta es podra ser 0 en la poblacin? En trminos de
contrastes de hiptesis
H0 : 1=0
H1 : 10
segn iii)
aqu t=7,546 con un valor p=0,002
se rechaza H0.
Para hacer estimacin por intervalos de la fuerza de la asociacin o el efecto
en este ejemplo para 1 al 95%

6,3352,776x0,840=(4,004 8,666)
y del mismo modo se ha calculado en la salida anterior, aunque en general tiene
menos inters, para 0
Interpretacin del contraste
Interpretacin del contraste 1=0

Si no se puede rechazar esta hiptesis, puede ocurrir que:
i) el modelo sea inapropiado, bien porque las variables son independientes, bien porque la
dependencia no sea lineal. Hay que investigar otros modelos.
ii) se cometa error tipo II, el modelo es adecuado, pero el tamao de la muestra es insuficiente.
Hay que calcular la potencia.
Si se rechaza la hiptesis puede ocurrir que:
i) el modelo es adecuado
ii) se cometa error tipo I
iii) exista una relacin no lineal, pero los datos son compatibles con un modelo lineal. Anlisis
de residuos.
Inferencias sobre la regresin
A veces interesa hacer inferencias sobre la propia regresin, es decir sobre Y|xi para
cualquier valor de xi . Si a los valores xi de la muestra se les aplica la ecuacin estimada, se
obtiene una estimacin de Y|xi
cuya distribucin muestral tambin es conocida. A veces se representan los intervalos de

confianza para la regresin en la denominada banda de confianza de la regresin. En la figura
se presenta la banda de confianza para los datos del ejemplo 3
Anlisis de la varianza de la regresin

Es un modo alternativo de hacer contrastes sobre el coeficiente 1. Consiste en
descomponer la variacin de la variable Y de dos componentes: uno la variacin
de Y alrededor de los valores predichos por la regresin y otro con la variacin de
los valores predichos alrededor de la media. Si no existe correlacin ambos
estimadores estimaran la varianza de Y y si la hay, no. Comparando ambos
estimadores con la prueba de la F se contrasta la existencia de correlacin. Para el
ejemplo 3
Observese que el valor de p es igual que antes (son contrastes equivalentes) y el

valor de F es el cuadrado del de t.
Ejemplo 4: Se quiere investigar el efecto de la ingestin masiva de vitamina C
sobre el hgado de las cobayas. Se eligen dos grupos de 4 cobayas, a uno se le
administra y al otro no. Se sacrifica a los animales y se mide la concentracin de
lpidos en el hgado.
Grupo control Tratado
(=0)
(=1)
23,8
13,8
15,4
9,3
21,7
17,2
18,0
15,1
Hay diferencia entre ambos grupos?

Se podra plantear un contraste sobre medias con la t de Student.
Tambin se puede plantear un modelo de regresin entre la variable grupo (X=0

control y X=1 tratado) y la variable lpido (Y)
Interpretar los coeficientes Qu es mejor?
Modelo II de regresion lineal
Modelo II de regresin lineal

Se asume que las variables X e Y son ambas variables aleatorias y que su fdp conjunta es
normal bivariante.
La normal bivariante es una extensin a
dos dimensiones de la normal univariante.
Su representacin grfica es una campana
tridimensional. Depende de 5 parmetros:
x, y, x, y y que son respectivamente
las medias, las desviaciones tpicas de X e
Y, y su coeficiente de correlacin. Dicho
coeficiente se define como
Siendo el numerador la llamada covarianza
Las propiedades de la normal bivariante son:

i) las fdps marginales son ambas normales con medias x, y y desviaciones tpicas x, y
respectivamente.
ii) las fdps condicionadas f(y|x) son tambin normales con medias y varianzas
obsrvese que la media depende linealmente de x, es decir, tambin se puede escribir
iii) simtricamente las fdps f(x|y)

A partir de una muestra aleatoria se pueden estimar los coeficientes por los mismos
procedimientos que en el modelo I y se obtienen los mismos resultados!! Ahora, sin
embargo, tambin se obtiene un estimador para el coeficiente de correlacin (la "famosa"
r) que no tiene sentido en el modelo I.
Propiedades del coeficiente de correlacin lineal
Propiedades del coeficiente de correlacin

i) nmero sin dimensiones entre -1 y 1.
ii) si las variables son independientes = 0. La inversa no es necesariamente
cierta, aunque si las variables son normales bivariantes s.
iii) si las variables estuvieran relacionadas linealmente =1
Un contraste que interesa realizar en un modelo II es H0: =0. Como
este contraste es totalmente equivalente al realizado sobre dicho coeficiente,

aunque tambin hay tablas basadas en que una cierta transformacin (de
Fisher) de r se distribuye aproximadamente como una normal.
Qu mide r?
Se puede demostrar una relacin algebraica entre r y el anlisis de la varianza
de la regresin de tal modo que su cuadrado (coeficiente de determinacin) es
la proporcin de variacin de la variable Y debida a la regresin. En este
sentido, r2 mide el poder explicatorio del modelo lineal.
Qu no mide r?
- no mide la magnitud de la pendiente ("fuerza de la asociacin")
- tampoco mide lo apropiado del modelo lineal
Potencia de los contrastes en regresin

Los contrastes se realizan en base al conocimiento de la distribucin muestral
del estadstico usado. En el caso de la regresin, las distribuciones usadas son
la normal (para r) y la t de Student (para los coeficientes). Slo para la normal es
fcil el clculo de la potencia, pero sabemos que la t tiende asintticamenta
(para muestras grandes (>30 en la prctica) a la normal. Usaremos esto.
1- = p(rechazar Ho| Ho falsa)
Supongamos que
asumamos normalidad qu potencia tiene el contraste si 1 fuera 5 (recordar

que se necesita concretar H1)?
Cundo rechazamos H0 al 95%?
Cuando
en nuestro caso mayor que 4,92. Como no lo es, no rechazamos H0. Hay que
calcular la probabilidad de encontrar
si 1 fuera 5. Calculamos
y lo miramos en la tabla de la normal 1- =0,512=51,2%.
Modelo de regresion mltiple
Modelo de regresin lineal mltiple

Las variables biolgicas suelen presentar multicorrelaciones. P.e. para estudiar
el efecto del consumo de grasas saturadas en el nivel del colesterol en sangre,
se puede plantear un modelo de RLS, sin embargo el nivel de colesterol puede
depender tambin de otras variables: consumo de otras substancias, ejercicio
realizado, edad, factores metablicos genticos, etc.
Si, para cada valor del consumo de grasas, las dems variables se distribuyen
aleatoriamente, la estimacin por RLS es adecuada y la variacin "debida" a las
otras variables estara incluida en la variacin aleatoria alrededor de la
regresin, pero en caso contrario la estimacin sera incorrecta, si p.e., las
costumbres dietticas variaran con la edad y sta influyera en el colesterol, una
parte no cuantificada de la variacin del colesterol que el modelo atribuye al
consumo de grasas sera "debida" a la edad.
La regresin lineal mltiple (RLM) es un modelo que permite estudiar estos
efectos. El modelo es
0 : media de Y cuando todas las Xi son cero (cuando no tiene sentido Xi=0, p.e.
edad, se interpreta como la media de Y que no depende de las Xi).
i : cambio en la media de Y cuando Xi aumenta una unidad permaneciendo
constantes las dems.
Las asunciones del modelo son una generalizacin de las de RLS y dado el
resultado de RLS no vamos a distinguir entre modelo I y II.
La estimacin de los coeficientes tambin se hace por mnimos cuadrados o
mxima verosimilitud y se obtienen los mismos resultados. Estos resultados,
usando notacin matricial, son (incluyen como caso particular la RLS):
siendo la matriz columna de coeficientes estimados, Y la matriz columna de

observaciones de la variable dependiente y X la denominada matriz de diseo
es decir la matriz de datos con una primera columna de 1's. Estos coeficientes
Modelo de regresion mltiple
se distribuyen como una normal multivariante cuya matriz de medias son los
verdaderos coeficientes y matriz de varianzas-covarianzas
un buen estimador de 2 es
que se distribuye como una 2 con n - (k+1) grados de libertad.

Estas frmulas ponen de manifiesto unas limitaciones al resolver estos modelos.
Para ello hay que invertir una matriz y no todas las matrices pueden invertirse
(singulares). En dos situaciones no se puede:
1. El nmero de observaciones (n), es menor o igual que el nmero de

variables independientes (k).
2. Una variable independiente es combinacin lineal de otra(s) o constante
(colinealidad ).
Estimacin y contrastes de hiptesis en modelos de regresion lineal
Estimacin y contrastes de hiptesis:

Usando la teora resumida en el apartado anterior, los intervalos de confianza
para los coeficientes se construyen igual que en RLS.
y los contrastes de hiptesis

H0: I = 0
H1: i 0
se realizan con el estadstico
Ejemplo 5
Dada una muestra hipottica de 20 pacientes en los que se ha recogido los
siguientes datos: nivel de colesterol en plasma sanguneo (en mg/100 ml), edad
(en aos), consumo de grasas saturadas (en gr/semana) y nivel de ejercicio
(cuantificado como 0: ningn ejercicio, 1: ejercicio moderado y 2: ejercicio
intenso), realizar el ajuste a un modelo lineal entre el nivel de colesterol y las
dems variables.
Tabla de datos
Paciente Colesterol Edad
Grasas Ejerci.
350
80
35
190
30
40
263
42
15
320
50
20
280
45
35
198
35
50
232
18
70
320
32
40
Estimacin y contrastes de hiptesis en modelos de regresion lineal
303
49
45
10
220
35
35
11
405
50
50
12
190
20
15
13
230
40
20
14
227
30
35
15
440
30
80
16
318
23
40
17
212
35
40
18
340
18
80
19
195
22
15
20
223
41
34
La salida del programa de ordenador es
Interpretemos esta "salida"
Anova de la regresin mltiple

De un modo similar a RLS se puede descomponer la variacin de la variable Y de dos
componentes: uno la variacin de Y alrededor de los valores predichos por la regresin y otro
con la variacin de los valores predichos alrededor de la media. Si el modelo lineal no es
adecuado, ambos estimadores estimaran la varianza de Y y si es adecuado no. Comparando
ambos estimadores con la prueba de la F se contrasta lo adecuado del modelo. Para el
ejemplo 5
Obsrvese que, a diferencia de la RLS, este contraste no es equivalente al realizado sobre los
coeficientes.
Se define tambin el coeficiente de determinacin como el cociente entre la suma de
cuadrados de la regresin y la suma de cuadrados total (R2 = SSR/SST) y a su raz cuadrada
(R) se le denomina coeficiente de correlacin mltiple.
Adems de esta prueba global del modelo basada en el anlisis de la varianza, se pueden
plantear pruebas parciales sobre si una variable, o un grupo de variables, aadidas a un
modelo previo lo mejoran.
Se tiene un modelo
y se aade una nueva variable X*, con el primer modelo se tiene una SSR(Y,X1,...,Xk) y con el
nuevo otra SSR(Y,X1,...,Xk,X*), la diferencia entre ambas ser lo que ha mejorado la suma de
cuadrados por aadir la variable X* y tendr 1 grado de libertad.
SSR(Y,X*|X1,...,Xk) = SSR(Y,X1,...,Xk,X*) - SSR(Y,X1,...,Xk) = SSE(Y,X1,...,Xk) SSE(Y,X1,...,Xk,X*)
y el cociente
llamado F parcial, tendr una distribucin F con 1 y n-(k+2) grados de libertad en la hiptesis
nula de que la nueva variable X* no mejore el modelo. Evidentemente este contraste es

totalmente equivalente a contrastar que el coeficiente * de la nueva variable es cero con la
prueba basada en la t.
Del mismo modo, si al modelo original se le aaden p variables X1*,...,Xp*, se puede definir
SSR(Y,X1*,...,Xp*|X1,...,Xk) = SSR(Y,X1,...,Xk,X1*,...,Xp*) - SSR(Y,X1,...,Xk) = SSE(Y,X1,...,Xk) SSE(Y,X1,...,Xk,X1*,...,Xp*)
que tiene p grados de libertad, y el cociente
se distribuye como una Fp,n-(k+p+1) en la hiptesis nula de que las nuevas p variables X1*, ...,
Xp* no mejoren el modelo con respecto a las k variables originales y permite contrastar dicha
hiptesis.
Ejemplo 6
Con los datos del ejemplo 5, realizar el contraste de la F parcial para aadir la variable ejercicio
a un modelo que slo contenga la edad y las grasas consumidas.
La tabla de anova correspondiente

al modelo con EDAD y GRASAS es
Por lo tanto, comparando esta tabla con la del modelo completo

SSR(COLEST,EJERC|GRASAS,EDAD) =
SSR(COLEST,GRASAS,EDAD,EJERC) - SSR(COLEST,GRASAS,EDAD) = 49275,94 48940,18 = 335,76
por tanto Fpar=335,76/3381,83=0,099
que se distribuye como una F1,16. Como F0,05(1,16) = 4,49 no se puede rechazar la hiptesis de
que EJERC no mejora el modelo. Obsrvese que esta Fpar es exactamente el cuadrado del
valor de t correspondiente al coeficiente de EJERC en el modelo con las tres variables
independientes.
VARIABLES "dummy"
Variables indicadoras ("dummy")

En los modelos de RLM la linealidad se asume. Esto, p.e. para la variable EJERC
del ejemplo anterior, quiere decir que el efecto sobre el colesterol de hacer ejercicio
intenso (EJERC=2) con respecto a no hacerlo (EJERC=0) es el doble que el del
ejercicio moderado (EJERC=1).
Es razonable esta asuncin? y para la variable FUMA codificada como 0: no
fuma, 1:fumador y 2:ex-fumador?
Una solucin podra ser crear tantas variables como categoras. No sirve porque
seran combinacin lineal y el modelo es irresoluble.
La solucin es crear tantas variables como categoras menos 1 (en los ejemplos
anteriores 2) denominadas variables indicadoras con el siguiente esquema
X1
X2
No-fumador
Fumador
Ex-fumador
Las variables X1 y X2 ya no son combinacin lineal y, por tanto, el modelo es

resoluble. El modelo quedara
0 es Y cuando X1 y X2 son ambas cero, es decir, para los no-fumadores; 0 +

1 es Y cuando X1 es 1 y X2 es 0, es decir fumadores, por lo tanto
1 es lo que cambia Y entre fumadores y no-fumadores y del mismo modo
2 es lo que cambia Y entre ex-fumadores y no-fumadores.
Con este esquema de codificacin los coeficientes tienen una clara interpretacin
cuando, como en este caso, una de las categoras (no-fumador) se quiere usar
como referencia para las dems.
A dicha categora se le asigna el valor cero para todas las variables indicadoras.
Sin embargo, para variables en las que no haya una categora que sea natural
usarla como referencia, por ejemplo genotipos, lugar de residencia, etc., es ms til
otro esquema de codificacin. Para discutirlo supngase la variable lugar de
residencia con cuatro lugares: A, B, C y D. Se crearn tres variables indicadoras
(siempre una menos que categoras) con el siguiente esquema
VARIABLES "dummy"
X1
X2
X3
-1
-1
-1
El modelo quedar
y por lo tanto
Y = 0 - 1 - 2 - 3 = Y|A para los residentes en A
Y = 0 + 1 = Y|B para los residentes en B
Y = 0 + 2 = Y|C para los residentes en C
Y = 0 + 3 = Y|D para los residentes en D
si se suman las 4 ecuaciones:
0 = ( Y|A + Y|B + Y|C + Y|D)/4 por lo tanto
0 es la media de Y en los cuatro lugares de residencia
1 la diferencia de los residentes en B con respecto a la media
2 la diferencia de los residentes en C con respecto a la media y
3 la diferencia de los residentes en D con respecto a la media y, evidentemente, 1 - 2 - 3 la diferencia de los residentes en A con respecto a la media. De modo
que a diferencia del esquema anterior, se usa como nivel de referencia la media en
todas las categoras en lugar de una de ellas.
Otro posible esquema de codificacin que a veces se usa en la literatura es
X1
X2
X3
VARIABLES "dummy"
y queda para el lector, a modo de ejercicio, la interpretacin de los coeficientes de

regresin en este caso.
Conviene destacar que estas variables indicadoras no tienen ningn sentido por s
solas y por, lo tanto, deben figurar en los modelos y se debe contrastar su inclusin
siempre en bloque, usando la F del modelo completo si slo estn dichas variables
en el modelo, o la F parcial correspondiente a las mismas si hay ms variables.
Ejercicio propuesto: Para los datos del Ejemplo 5, crear "dummys" para el ejercicio
(con qu esquema?) y contrastar (con la F parcial) si estas variables mejoran el
modelo que slo contiene edad y grasas. Interpretar los coeficientes.
Ejemplo 7: Considrense los siguientes datos, procedentes de una muestra
hipottica, sobre presin arterial en cm de Hg y "status" de fumador, codificado
como 0: no-fumador, 1: fumador y 2: ex-fumador. Discutir el modelo de regresin
entre presin arterial y "status" de fumador y estimar por intervalos la presin
arterial media segn el "status" de fumador, a partir de los resultados del modelo
ms adecuado.
Paciente Presin arte. Fumador
1
15,0
19,0
16,3
22,0
18,0
19,8
23,2
14,4
20,3
10
22,0
11
20,5
12
19,0
13
12,7
14
14,0
VARIABLES "dummy"
15
11,8
16
11,2
17
14,0
18
19,5
19
22,3
20
15,0
21
12,6
22
16,4
23
13,5
24
13,7
Los resultados de un modelo entre presin arterial y "status" de fumador tal y como
est codificado en la tabla son
En este caso de una nica variable independiente, el contraste sobre el modelo

global con la F es equivalente al realizado con la t sobre el coeficiente 1 y con
ninguno se puede rechazar la hiptesis nula (p=0,250) de no dependencia. Es
decir, analizado de este modo no hay dependencia entre ambas variables.
Si se crean dos variables indicadoras (FUMA y EX_FUMA) con el primer esquema
VARIABLES "dummy"
discutido antes la tabla de datos queda

PACIEN
PRE_AR
FUMADOR FUMA
EX_FUMA
15.0
19.0
16.3
22.0
18.0
19.8
23.2
14.4
20.3
10
22.0
11
20.5
12
19.0
13
12.7
14
14.0
15
11.8
16
11.2
17
14.0
18
19.5
19
22.3
20
15.0
21
12.6
22
16.4
23
13.5
VARIABLES "dummy"
24
13.7
y el modelo entre PRE_AR y FUMA y EX_FUMA
Para contrastar si la presin arterial depende del "status" de fumador, deber

usarse el contraste basado en la F (p=0,018) y por lo tanto al nivel de significacin
habitual =0,05 se rechaza la hiptesis nula de no dependencia. A pesar de que el
coeficiente para EX_FUMA no es significativamente distinto de 0 (p=0,220), se
mantiene en el modelo porque FUMA no tiene sentido por s sola.
Obsrvese que usando las variables indicadoras se ha encontrado una
dependencia que antes no se haba puesto de manifiesto, debido a la falta de
linealidad para los cdigos usados.
La estimacin puntual de la presin arterial media de los no-fumadores (0 en el
modelo) es 14,789 con un error estndar estimado de 1,07 y, como t0,025(21) =
2,08, su intervalo de confianza al 95% es 14,789 2,08x1,07 = (12,563 17,014).
La estimacin del aumento medio de la presin arterial en los fumadores (1) es
5,068 que es significativamente distinto de cero (p=0,005) y la estimacin del
aumento medio de la presin arterial en los ex-fumadores ( 2) es 1,974 pero no es
significativamente distinto de cero (p=0,220).
Para realizar la estimacin por intervalos de la presin media en fumadores (0 +
1) y ex-fumadores ( 0 + 2) se necesita estimar sus respectivas varianzas
VARIABLES "dummy"
var( 0 + 1) = var( 0) + var( 1) + 2cov( 0 , 1) = 1,145 + 2,618 - 2 x 1,145 =

1,473
EE( 0 + 1) = 1,214
var( 0 + 2) = var( 0) + var( 2) + 2cov( 0 , 2) = 1,145 + 2,434 - 2 x 1,145 =
1,289
EE(0 + 2) = 1,135
Por lo tanto los intervalos de confianza al 95% para la presin arterial media de
fumadores y ex-fumadores son
fumadores: (14,789+5,068) 2,08x1,214 = (17,332 22,382)
ex-fumad : (14,789+1,974) 2,08x1,135 = (14,402 19,124)
recordemos que para no-fumadores se haba obtenido
no-fumad : 14,789 2,08x1,07 = (12,563 17,015)
y que la diferencia entre no-fumadores y ex-fumadores no es significativa, mientras
que la diferencia entre no-fumadores y fumadores s lo es.
Interaccin y confusin con los modelos de regresin lineal
Interaccin y confusin en la regresin

Los modelos de regresin pueden usarse con dos objetivos:
1) predictivo en el que el inters del investigador es predecir lo mejor posible la
variable dependiente, usando un conjunto de variables independientes y
2) estimativo en el que el inters se centra en estimar la relacin de una o ms
variables independientes con la variable dependiente. En el ejemplo desarrollado
en los apartados anteriores, el inters podra ser encontrar el modelo que mejor
prediga el nivel de colesterol en sangre, en funcin de las otras variables (objetivo
1) o simplemente cuantificar la relacin entre el consumo de grasas y dicho nivel
de colesterol (objetivo 2).
El resultado de un modelo predictivo es el modelo mismo, mientras que en un
modelo estimativo es la estimacin del coeficiente de la variable de inters. El
segundo objetivo es el ms frecuente en estudios etiolgicos en los que se trata
de encontrar factores determinantes de una enfermedad o un proceso.
La interaccin y la confusin son dos conceptos importantes cuando se usan los
modelos de regresin con el segundo objetivo, que tienen que ver con la
interferencia que una o varias variables pueden realizar en la asociacin entre
otras.
Existe confusin cuando la asociacin entre dos variables difiere
significativamente segn que se considere, o no, otra variable, a esta ltima
variable se le denomina variable de confusin para la asociacin.
Existe interaccin cuando la asociacin entre dos variables vara segn los
diferentes niveles de otra u otras variables. Aunque en una primera lectura pueden
parecer similares, conviene distinguir claramente entre ambos fenmenos. En el
ejemplo 5 la edad no presenta una correlacin significativa con el nivel de
colesterol si no se considera el consumo de grasas, mientras que si se considera
dicho consumo, s lo presenta, en este caso el consumo de grasas es una variable
de confusin para la asociacin entre colesterol y edad. Para que exista confusin
no es necesario que exista un cambio tan drstico (la correlacin es significativa
en un caso y no lo es en el otro), tambin puede ocurrir que, an siendo
significativa en ambos casos, cambie el coeficiente de regresin. Evidentemente la
mejor estimacin del coeficiente es la que se obtiene del modelo en que figura la
variable de confusin, en el ejemplo, la mejor estimacin del coeficiente
correspondiente a la edad es la del modelo con edad y consumo de grasas.
En el mismo ejemplo, si la asociacin entre la edad y el nivel de colesterol fuera
diferente para los individuos que realizan ejercicio que para los que no lo realizan,
se dira que, para el nivel de colesterol, existe interaccin entre la edad y el
ejercicio realizado. En este caso no existe una nica estimacin del coeficiente de
la variable de inters, sino que habra una estimacin para cada nivel de la otra
variable, es decir y en el ejemplo, una estimacin de la relacin entre el nivel de
colesterol y la edad para los individuos que realizan ejercicio y otra distinta para
los que no lo realizan.

Veamos estos conceptos sobre los modelos. El modelo ms sencillo para estudiar
la asociacin entre una variable Y y otra variable X1 es
Y = 0 + 1 X1
donde 1 cuantifica la asociacin: es el cambio en Y por unidad de cambio en X1.
Se dice que X2 es una variable de confusin para esta asociacin, si el modelo
Y = 0 + 1 X1 + 2 X2
produce una estimacin para 1 diferente del modelo anterior. Evidentemente
esta definicin se puede ampliar a un conjunto de variables, se dice que las
variables X2, ..., Xk son variables de confusin si la estimacin de 1 obtenida por
el modelo
Y = 0 + 1 X1 + 2 X2 + ... + k Xk
es diferente de la obtenida en el modelo simple. En ambos casos se dice que la
estimacin de 1 obtenida en los modelos mltiples est controlada o ajustada por
X2 o por X2 ,..., Xk
Contrastar la existencia de confusin requiere, por lo tanto, comparar los
coeficientes de regresin obtenidos en dos modelos diferentes y si hay diferencia,
existe la confusin, en cuyo caso la mejor estimacin es la ajustada. Para dicha
comparacin no se precisa realizar un contraste de hiptesis estadstico ya que
aunque la diferencia encontrada sea debida al azar, representa una distorsin que
la estimacin ajustada corrige. Ser el investigador quin establezca el criterio
para decidir cuando hay diferencia. Ntese que se est hablando de diferencia en
la estimacin, que puede afectar tanto al propio coeficiente como a su error
estndar (lo habitual es considerar que existe confusin cuando el coeficiente o su
error estndar cambian en ms del 10%).
El modelo ms sencillo que hace explcita la interaccin entre dos variables X1 y
X2 es
Y = 0 + 1 X1 + 2 X2 + 3 X1 X2
En este modelo, el valor de Y para unos valores determinados x1, x2 de X1, X2 es
Y = 0 + 1 x1 + 2 x2 + 3 x1 x2
y para los valores x1 + 1 y x2
Y = 0 + 1(x1 + 1) + 2 x2 + 3 (x1 + 1) x2 = 0 + 1 x1 + 1 + 2 x2 + 3 x1 x2
+ 3 x2
restando ambas se encuentra el cambio en Y por una unidad de cambio en X1
manteniendo fijo X2
1 + 3 x2
que es diferente para cada valor x2 de X2. Del mismo modo, el cambio en Y por
una unidad de cambio en X2 manteniendo fijo X1 es
2 + 3 x1
Por lo tanto, contrastar la existencia de interaccin entre X1 y X2 es contrastar si el
coeficiente 3 es cero (no hay interaccin), o distinto de cero (existe interaccin).
En caso de que exista interaccin los coeficientes 1 y 2 por s solos no
significan nada y la asociacin de las variables X1 y X2 con Y estar cuantificada
por las expresiones anteriores.
Es obvio que primero debe contrastarse la interaccin y despus, en caso de que
no exista, la confusin.
Ejemplo 8
En un trabajo para estudiar la relacin de la presin arterial sistlica con el
consumo de tabaco y caf, codificadas ambas como 0: no y 1: s, se han obtenido
los siguientes datos de una muestra aleatoria hipottica
Paciente Presin arte. Tabaco
Caf
15,0
11,0
26,3
13,0
18,0
19,8
23,2
14,4
13,3
10
12,0
11
22,5
12
23,5
13
12,7
14
14,0
15
11,8
16
21,2
17
14,0
18
15,5
19
12,3
20
15,0
21
22,6
22
16,4
23
23,5
24
13,7
Contrastar la existencia de interaccin y confusin y obtener la mejor estimacin

por intervalos para el efecto de ambos factores.
Para contrastar la existencia de interaccin se crea una nueva variable (TABXCA)
que sea el producto de la variables TABACO y CAFE y se hace un modelo de
regresin con las 3 variables. El resultado es
Segn la tabla de anova, el modelo completo es muy significativo (p=0,000). El

coeficiente de correlacin mltiple es muy alto, ya que la proporcin de suma de
cuadrados explicada por la regresin (R2) es aproximadamente del 82%. El
coeficiente del trmino de interaccin es significativamente distinto de cero
(p=0,000), y aunque el del trmino del CAFE no lo sea (p=0,332) se mantiene en
el modelo en aplicacin del principio jerrquico.
Hay interaccin entre CAFE y TABACO y no puede hablarse, por lo tanto, de un
efecto del tabaco, sino que hay un efecto del tabaco para los consumidores de
caf y otro distinto para los no consumidores de caf y, del mismo modo, hay un
efecto del caf para los consumidores de tabaco y otro efecto para los no
consumidores de tabaco.
Vamos a estimar el efecto del tabaco.
La presin arterial media en la muestra es 16,86 y la estimacin de la presin
arterial de los no-fumadores y no consumidores de caf (0) es 13,8.
Segn vimos antes la estimacin del efecto del tabaco (cambio en la presin
arterial media por ser fumador) es para los no consumidores de caf 1 y para los
consumidores de caf 1 + 3. La varianza estimada de esta ltima estimacin es
var( 1 + 3) = var( 1) + var( 3) + 2cov( 1 , 3) = 1,779 + 3,251 + 2x(-1,779)

= 1,472
por lo tanto EE( 1 + 3) = 1,213. Como t0,025(20)= 2,086 los intervalos de
confianza estimados al 95% para el efecto del tabaco son
no consumidores de caf: 9,457 2,086x1,334 = ( 6,675 12,240)
consumidores: 9,457-10,852 2,086x1,213 = (-3,925 1,135)
para los no consumidores de caf, el tabaco aumenta la presin arterial media en
9,457 unidades y este aumento es significativamente distinto de cero, mientras
que para los consumidores de caf la disminuye en -1,395 unidades, si bien esta
disminucin no es significativamente distinta de cero (su intervalo de confianza
incluye el cero).
Estrategias de modelizacin
El problema es cmo usamos todo esto? Debido a los dos objetivos distintos
que un anlisis de regresin puede tener es difcil establecer una estrategia
general para encontrar el mejor modelo de regresin, es ms, el mejor modelo
significa cosas distintas con cada objetivo.
En un anlisis predictivo el mejor modelo es el que produce predicciones ms
fiables para una nueva observacin, mientras que en un anlisis estimativo el
mejor modelo es el que produce estimaciones ms precisas para el coeficiente
de la variable de inters.
En ambos casos se prefiere el modelo ms sencillo posible (a este modo de
seleccionar modelos se le denomina parsimonia), de modo que en un anlisis
estimativo, se puede excluir del modelo una variable que tenga un coeficiente
significativamente distinto de cero y que su contribucin a la prediccin de la
variable dependiente sea importante, porque no sea variable de confusin para
la variable de inters (el coeficiente de dicha variable no cambia), en un anlisis
predictivo esa variable no se excluira.
Sin embargo, hay una serie de pasos que deben realizarse siempre:
i) Especificacin del modelo mximo.
ii) Especificacin de un criterio de comparacin de modelos y definicin de una
estrategia para realizarla.
iii) Evaluacin de la fiabilidad del modelo.
i) Especificacin del modelo mximo
Se trata de establecer todas las variables que van a ser consideradas.
Recurdese que el modelo saturado (el mximo que se puede considerar) tiene
n - 1 variables pero que, con este modelo, los grados de libertad para SSE son
cero, y R2=1, de modo que, en general, el modelo saturado no tiene inters y el
modelo mximo deber tener menos variables independientes que el modelo
saturado (un criterio habitual es incluir como mximo una variable cada 10
casos).
El criterio para decidir qu variables forman el modelo mximo lo establece el
investigador en funcin de sus objetivos y del conocimiento terico que tenga
sobre el problema, evidentemente cuanto menor sea el conocimiento previo
mayor tender a ser el modelo mximo.
Un modelo mximo grande minimiza la probabilidad de error tipo II o infraajuste,
que en un anlisis de regresin consiste en no considerar una variable que
realmente tiene un coeficiente de regresin distinto de cero.
Un modelo mximo pequeo minimiza la probabilidad de error tipo I o
sobreajuste (incluir en el modelo una variable independiente cuyo coeficiente de
regresin realmente sea cero).
Debe tenerse en cuenta tambin que un sobreajuste, en general, no introduce

sesgos en la estimacin de los coeficientes (los coeficientes de las otras
variables no cambian), mientras que un infraajuste puede producirlos, pero que
un modelo mximo grande aumenta la probabilidad de problemas de
colinealidad.
En el modelo mximo deben considerarse tambin los trminos de interaccin
que se van a introducir (en un modelo estimativo slo interesan interacciones
entre la variable de inters y las otras) y la posibilidad de incluir trminos no
lineales. En Biologa son muy frecuentes relaciones no lineales, que pueden
modelizarse con trminos cuadrticos o de mayor orden o con transformaciones
tales como la exponencial o el logaritmo.
En el ejemplo 5 podra considerarse que la dependencia del nivel de colesterol
en sangre con las grasas consumidas puede no ser lineal y presentar, por
ejemplo, saturacin: por encima de un cierto nivel de grasas ingeridas el
colesterol en sangre ya no sube ms, o un punto umbral: las grasas consumidas
elevan el colesterol, slo si sobrepasan un cierto valor. Cada uno de estos
fenmenos puede modelarse satisfactoriamente con un trmino cuadrtico o
una transformacin logartmica o exponencial (introducir en el modelo junto con,
o en lugar de, la variable GRASAS, la variable (GRASAS)2; o log(GRASAS) o
EXP(GRASAS)) y ambos juntos, con un trmino cbico ((GRASAS)3).
ii) Comparacin de modelos
Debe establecerse cmo y con qu se comparan los modelos. Si bien hay varios
estadsticos sugeridos para comparar modelos, el ms frecuentemente usado es
la F parcial, recordando que cuando los dos modelos slo difieren en una
variable, el contraste sobre la F parcial es exactamente el mismo que el
realizado con la t sobre el coeficiente de regresin, pero a veces interesa
contrastar varias variables conjuntamente mejor que una a una (por ejemplo
todos los trminos no lineales) o, incluso, es necesario hacerlo (por ejemplo
para variables indicadoras).
Hay que hacer notar que en un anlisis estimativo el criterio para incluir o excluir
variables distintas a las de inters, es sobre todo los cambios en los coeficientes
y no los cambios en la significacin del modelo.
Los distintos modelos a comparar se pueden construir de dos formas: por
eliminacin o hacia atrs ("backward") y por inclusin o hacia adelante
("forward").
Con la primera estrategia, se ajusta el modelo mximo y se calcula la F parcial
para cada variable como si fuera la ltima introducida (que es equivalente a la t
para esa variable), se elige la menor de ellas y se contrasta con el nivel de
significacin elegido. Si es mayor o igual que el valor crtico se adopta este
modelo como resultado del anlisis y si es menor se elimina esa variable y se

vuelve a repetir todo el proceso hasta que no se pueda eliminar ninguna
variable.
Con la estrategia hacia adelante, se empieza con un modelo de una variable,
aquella que presente el mayor coeficiente de correlacin simple. Se calcula la F
parcial para la inclusin de todas las dems, se elige la mayor de ellas y se
contrasta con el nivel de significacin elegido. Si es menor que el valor crtico,
se para el proceso y se elige el modelo simple como mejor modelo, y si es
mayor o igual que dicho valor crtico, esa variable se incluye en el modelo y se
vuelve a calcular la F parcial para la inclusin de cada una de todas las
restantes, y as sucesivamente hasta que no se pueda incluir ninguna ms.
Una modificacin de esta ltima estrategia es la denominada "stepwise" que
consiste en que, cada vez que con el criterio anterior se incluye una variable, se
calculan las F parciales de todas las incluidas hasta ese momento como si
fueran las ltimas y la variable con menor F parcial no significativa, si la hubiera,
se elimina. Se vuelven a calcular las F parciales y se continua aadiendo y
eliminando variables hasta que el modelo sea estable.
Las variaciones a estas estrategias consisten en que, con cualquiera de ellas, se
puede contrastar varias variables en lugar de una sola y que, en aplicacin del
principio jerrquico, cuando se contrasta un trmino de interaccin, el modelo
debe incluir todos los trminos de orden inferior y, si como resultado del
contraste, dicho trmino permanece en el modelo, tambin ellos deben
permanecer en el mismo, aunque no se pueda rechazar que los coeficientes
correspondientes no son distintos de cero.
En cualquier caso, puede ser peligroso aplicar cualquiera de estas estrategias
automticamente (con un paquete estadstico, por ejemplo) por lo que se ha
comentado ms arriba sobre los distintos criterios dependiendo del objetivo del
estudio, los trminos de interaccin y las variables indicadoras.
Ejemplo 9
Encontrar el mejor modelo para los datos del ejemplo 5, con el objetivo de
estimar el efecto del consumo de grasas sobre el nivel del colesterol y usando la
estrategia hacia atrs.
El modelo mximo estara formado por EDAD, GRASAS, EJERC (teniendo en
cuenta que est codificado en 3 niveles podra ser conveniente analizarlo a
travs de 2 variables indicadoras, pero no se va a hacer por simplicidad del
ejemplo), se considerar tambin el trmino (GRASAS)2 para analizar
relaciones no lineales y los trminos de interaccin entre GRASAS y EDAD y
entre GRASAS y EJERC. La interaccin entre EDAD y EJERC en este caso no
interesa, puesto que la variable de inters es GRASAS.
En el archivo de datos, habr que crear 3 variables nuevas: GRASA2 =
(GRASAS)2, GRAXED = GRASAS x EDAD y GRAXEJ = GRASAS x EJERC y el

resultado del anlisis del modelo mximo es
Recordando que la F parcial de una variable dadas todas las dems es el

cuadrado del valor de t para el coeficiente de la misma, la variable que tiene
menor F parcial no significativa es GRAXEJ, por lo tanto esta variable se elimina
y se ajusta ahora un modelo excluyndola.
Obsrvese que R apenas ha disminuido (R siempre disminuye al quitar variables

y su disminucin es otro de los estadsticos propuestos para comparar modelos)
pero la F global ha mejorado (p=0,018 frente a 0,040).
En este modelo la menor F parcial no significativa corresponde a EDAD, sin
embargo, en el modelo todava est el trmino de interaccin entre EDAD y
GRASAS (GRAXED) en consecuencia EDAD no se puede quitar (principio
jerrquico), la siguiente F parcial corresponde a EJERCI y no es significativa, en
consecuencia se quita EJERCI. El nuevo modelo es
No hay cambios en los coeficientes de GRASAS, ni GRASA2, ni GRAXED

(EJERCI no es variable de confusin, por lo tanto se puede eliminar
definitivamente. Si hubiera habido cambios no se podra eliminar a pesar de no
ser significativa).
La variable con menor F parcial sigue siendo EDAD y la siguiente GRAXED. Se
quita y el nuevo modelo es
La menor F parcial no significativa es, ahora, la de GRASAS, pero GRASA2

debe contrastarse antes y como tampoco es significativa (obsrvese, no
obstante, que est en el borde y podra tratarse de un problema de falta de
potencia) se quitara GRASA2. El modelo finalmente queda
Donde la F global es significativa siendo tambin significativas las F parciales de

las dos variables que permanecen, de modo que ste podra ser el modelo final.
No obstante, como el objetivo del estudio es estimar el efecto de las grasas, se
debera probar un modelo sin la edad y si en ste ltimo modelo no hubiera
cambios en la estimacin del efecto de las grasas, podra quitarse la edad, en
aplicacin del principio de parsimonia.
Como el cambio en el coeficiente es mayor que el 10%, concluimos que EDAD

es variable de confusin y el modelo final es el que comntoene GRASAs y
EDAD.
iii) Evaluacin de la fiabilidad del modelo
Una vez encontrado el mejor modelo hay que evaluar su fiabilidad, es decir,
evaluar si se comporta igual en otras muestras extradas de la misma poblacin.
Evidentemente, el modo ms completo de evaluarlo ser repetir el estudio con
otra muestra y comprobar que se obtienen los mismos resultados, aunque
generalmente esta aproximacin resulta excesivamente costosa.
Otra aproximacin alternativa consiste en partir aleatoriamente la muestra en
dos grupos y ajustar el modelo con cada uno de ellos y si se obtienen los
mismos resultados se considera que el modelo es fiable. Esta aproximacin es
demasiado estricta ya que, en la prctica, casi nunca se obtienen los mismos
resultados.
Una validacin menos estricta consiste en ajustar el modelo sobre uno de los
grupos (grupo de trabajo) y calcular su R2, que se puede interpretar como el
cuadrado del coeficiente de correlacin simple entre la variable dependiente y
las estimaciones obtenidas en la regresin.

Despus, y con el modelo obtenido en el grupo de trabajo, calcular las
estimaciones de la variable dependiente en el otro grupo (grupo de validacin) y
calcular el coeficiente de correlacin simple al cuadrado entre estas
estimaciones y la variable dependiente (R2*), a este coeficiente se le denomina
coeficiente de correlacin de validacin cruzada. A la diferencia R2-R2* se le
denomina reduccin en la validacin cruzada y, aunque no hay reglas firmes al
respecto, se considera que una reduccin superior a 0,90 indica un modelo no
fiable y una reduccin inferior a 0,10 indica un modelo muy fiable.
Otras lecturas
Silva Ayaguer L.C., Barroso Utra I.M. Seleccin algortmica de modelos en las
aplicaciones biomdicas de la regresin mltiple. Medicina Clnica.
2001;116:741-745.
El problema de la colinealidad
Es uno de los problemas ms desesperantes con que uno se puede encontrar en un
anlisis de regresin. Como ya vimos al hablar de la estimacin de los coeficientes,
si en un modelo de RLM alguna variable independiente es combinacin lineal de
otras, el modelo es irresoluble, debido a que, en ese caso, la matriz X'X es singular,
es decir, su determinante es cero y no se puede invertir.
A este fenmeno se le denomina colinealidad. Que una variable X1 sea combinacin
lineal de otra X2, significa que ambas estn relacionadas por la expresin X1 = 1 +
2X2, siendo 1 y 2 constantes, por lo tanto el coeficiente de correlacin entre
ambas variables ser 1.
Del mismo modo, que una variable X1 sea combinacin lineal de otras X2, ..., Xi con
i>2, significa que dichas variables estn relacionadas por la expresin X1 = 1 +
2X2 + ... + iXi, siendo 1,..., i constantes y por tanto, el coeficiente de correlacin
mltiple RX1|X2,...Xi tambin ser 1.
Otro modo, por tanto, de definir la colinealidad es decir que existe colinealidad
cuando alguno de los coeficientes de correlacin simple o mltiple entre algunas de
las variables independientes es 1, es decir, cuando algunas variables
independientes estn correlacionadas entre s.
En la prctica, esta colinealidad exacta raras veces ocurre, pero s surge con cierta
frecuencia la llamada casi-colinealidad, o por extensin, simplemente colinealidad
en que alguna variable es "casi" combinacin lineal de otra u otras, o dicho de otro
modo, algunos coeficientes de correlacin simple o mltiple entre las variables
independientes estn cercanos a 1, aunque no llegan a dicho valor.
En este caso la matriz X'X es casi-singular, es decir su determinante no es cero
pero es muy pequeo. Como para invertir una matriz hay que dividir por su
determinante, en esta situacin surgen problemas de precisin en la estimacin de
los coeficientes, ya que los algoritmos de inversin de matrices pierden precisin al
tener que dividir por un nmero muy pequeo, siendo adems inestables.
Adems, como la matriz de varianzas de los estimadores es proporcional a X'X,
resulta que en presencia de colinealidad los errores estndar de los coeficientes son
grandes (hay imprecisin tambin en sentido estadstico).
Por consiguiente, a la hora de plantear modelos de RLM conviene estudiar
previamente la existencia de casi-colinealidad (la colinealidad exacta no es
necesario estudiarla previamente, ya que todos los algoritmos la detectan, de hecho
no pueden acabar la estimacin). Como medida de la misma hay varios estadsticos
propuestos, los ms sencillos son los coeficientes de determinacin de cada variable
independiente con todas las dems, es decir
y, relacionados con ellos, el factor de inflacin de la varianza (FIV) y la tolerancia

(T), definidos como
Una regla emprica, citada por Kleinbaum, consiste en considerar que existen
problemas de colinealidad si algn FIV es superior a 10, que corresponde a algn
R2i 0,9 y Ti < 0,1.
Aunque puede existir colinealidad con FIV bajos, adems puede haber
colinealidades que no impliquen a todas las variables independientes y que, por
tanto, no son bien detectadas por el FIV.
Otra manera, ms completa, de detectar colinealidad es realizar un anlisis de
componentes principales de las variables independientes. Esta tcnica es
matemticamente compleja y aqu se hace slo un resumen de la misma necesario
para entender el diagnstico de la colinealidad.
Se denominan componentes principales de un conjunto de variables a otras
variables, combinacin lineal de las originales y que tienen tres propiedades
caractersticas:
i) son mutuamente independientes (no estn correlacionadas entre s)
ii) mantienen la misma informacin que las variables originales
iii) tienen la mxima varianza posible con las limitaciones anteriores.
De hecho, para modelos predictivos los componentes principales son las variables
independientes ideales.
La varianza de cada componente principal es un autovalor (nmero asociado a una
matriz) de la matriz de varianzas-covarianzas de las variables originales.
El nmero de autovalores nulos indica el nmero de variables que son combinacin
lineal de otras (el nmero de colinealidades exactas) y autovalores prximos a cero
indican problemas graves de colinealidad.
El clculo de los autovalores permite, por lo tanto, determinar no slo la existencia
de colinealidad, sino tambin el nmero de colinealidades.
Para determinar cundo un autovalor pequeo est suficientemente prximo a cero
se usa su valor relativo con respecto al mayor, en este sentido, para cada autovalor
se define el ndice de condicin como la raz cuadrada del cociente entre el mayor
de ellos y dicho autovalor y se denomina nmero de condicin al mayor de los
ndices de condicin.
Para Belsley ndices de condicin entre 5 y 10 estn asociados con una colinealidad
dbil, mientras que ndices de condicin entre 30 y 100 sealan una colinealidad
moderada a fuerte.
Una vez determinada la presencia y el nmero de colinealidades, es conveniente
averiguar qu variables estn implicadas en ellas. Usando ciertas propiedades de la
matrices se puede calcular la proporcin de la varianza de las variables sobre cada
componente.
Si dos o ms variables tienen una proporcin de varianza alta en un componente
indica que esas variables estn implicadas en la colinealidad y, por tanto, la
estimacin de sus coeficientes est degradada por la misma.
Belsley propone usar conjuntamente los ndices de condicin y la proporcin de
descomposicin de varianza para realizar el diagnstico de colinealidad, usando
como umbral de proporcin alta 0,5 de modo que, finalmente, dicho diagnstico se
har:
Los ndices de condicin altos (mayores que 30) indican el nmero de colinealidades
y la magnitud de los mismos mide su importancia relativa.
Si un componente tiene un ndice de condicin mayor que 30 y dos o ms variables
tienen un proporcin de varianza alta en el mismo, esas variables son colineales.
Como ya se indic ms arriba, la mejor solucin a los problemas de colinealidad
consiste en plantear el modelo de regresin con los componentes principales en
lugar de con las variables originales, si bien esta solucin slo est indicada en los
modelos predictivos.
En los modelos estimativos no tiene sentido, ya que el inters del modelo es,
justamente, estimar el efecto sobre la variable independiente de una variable
determinada y no interesa, por lo tanto, usar otras variables distintas.
Otras soluciones alternativas planteables en ambos tipos de modelos pueden ser:
cambios de escala en las variables, incluyendo el centrado de las mismas (restar a
cada variable su media) o, incluso, eliminar alguna de las variables colineales.
En este mismo sentido hay que tener en cuenta que las variables producto
introducidas para estudiar la interaccin pueden dan lugar a problemas de
colinealidad y no se recomienda, por lo tanto, que un modelo contenga muchos
trminos de interaccin.
Si una variable toma el mismo valor para todas las observaciones (tiene varianza
cero) existe colinealidad exacta con el trmino independiente, y si una variable tiene
varianza casi cero (toma valores muy prximos para todas las observaciones) existe
casi-colinealidad.
Puede ocurrir que una varianza pequea sea debida a una escala inapropiada para
la variable, por ejemplo, si la edad de sujetos adultos se mide en dcadas se obtiene
una varianza 100 veces menor que si se midiera en aos. En este caso un cambio
de escala puede evitar el problema de la colinealidad.
Tambin se puede perder precisin en el clculo de (X'X)-1 por la existencia de
variables con varianzas excesivamente grandes, en cuyo caso el cambio de escala
aconsejable sera el contrario, por ejemplo, podra dar lugar a problemas de
precisin medir la edad en das.
Ejemplo 10
Realizar el estudio de colinealidad en los datos del ejemplo 5, usando los FIV, los
ndices de condicin y la matriz de proporcin de descomposicin de la varianza de
los estimadores.
Realizando los anlisis de regresin de cada una de las variables independientes
con todas las dems, se obtienen los siguientes coeficientes de determinacin,
tolerancia y factores de inflacin de la varianza
que indican problemas graves de colinealidad.

Obsrvese que el factor de inflacin mayor corresponde a la variable GRASAS,
resultado esperable debido a que se han creado tres variables ms (GRASA2,
GRAXED y GRAXEJ) a partir de ella.
Los autovalores de la matriz X'X y los ndices de condicin, as como la matriz de
proporcin de descomposicin de varianza son:
Hay un ndice de condicin alto (50,781) y asociado con el mismo hay cinco
variables (el trmino constante, GRASAS, GRASA2, EDAD y GRAXED) con
proporcin de varianza alta.
Nos indica, por tanto, que GRASAS es colineal con GRASA2, GRAXED (no nos
sorprende), EDAD y con la constante.
Al existir esta ltima colinealidad, el centrado de variables podra mejorar el
problema, se podra tambin renunciar a estudiar los trminos no lineales GRASA2
y GRAXED.
Empecemos por centrar las variables continuas.
GRASAC = GRASAS - 39,7
EDADC = EDAD - 36,25
GRASC2 = GRASAC x GRASAC
GRXEDC = GRASAC x EDADC
GRXEJC = GRASAC x EJERC
y, para ellas, el diagnstico de colinealidad queda:
y tanto los ndices de condicin como la proporcin de varianza, indican que el

centrado ha resuelto los problemas de colinealidad.
Referencias
D.G. Kleinbaum, L.L. Kupper, K.E. Muller
Applied Regression Analysis and Other Multivariables Methods.
PWS-KENT Publishing Company. 1988.
D.A. Belsley
Conditioning Diagnostics: Collinearity and Weak Data in Regression.
John Wiley &Sons. 1991
Anlisis de los residuos

Si bien para la estimacin por mnimos cuadrados de los coeficientes de un modelo de
regresin, slo es necesaria la asuncin de linealidad, la normalidad de los mismos, en
base a la cual se realizan los contrastes de hiptesis, est basada tambin en las
asunciones de normalidad y homoscedasticidad. Por consiguiente, conviene asegurar que
dichas asunciones se cumplen en cada caso.
Hay que tener en cuenta que, en caso de que no se cumpla la normalidad, no se puede
utilizar la t ni la F para los contrastes de hiptesis. Puede usarse, sin embargo, la
desigualdad de Tchebysheff, que establece que para cualquier variable aleatoria
siendo k cualquier nmero real positivo. Otro modo alternativo de escribirlo es
Por lo tanto, un modo de contrastar, sin la asuncin de normalidad, la hiptesis nula

H0 : i = a
es calcular el cociente
y la probabilidad de error tipo I al rechazarla es 1/k2

Esta prueba tampoco se puede usar si no se cumple la homoscedasticidad, pues en ese
caso la estimacin de EE(i) no es vlida.
Recordando la 2 formulacin del modelo, las asunciones se pueden resumir en que las
variables x1,...,xk son independientes, distribuidas normalmente con media cero y todas
con la misma varianza 2
x1,...,xk es un conjunto de variables, una para cada combinacin x1,...,xk de valores de
las variables X1,...,Xk.
denominados residuos, son los valores que en la muestra toman estas variables.
Generalmente, sin embargo, no se tienen suficientes de estos valores muestrales para
cada variable (para el problema del ejemplo 5, por ejemplo, existe una variable x1,...,xk
para cada valor de la edad, del consumo de grasas y del ejercicio; el residuo para el primer
paciente corresponde a la variable 80,35,0; el del segundo a la variable 30,40,2; etc., es
decir, para cada variable slo se tiene un valor muestral.

Para el problema del ejemplo 8, sin embargo, slo hay cuatro variables: 0,0, 1,0, 0,1 y
1,1 y s puede haber suficientes valores muestrales para cada una de ellas como para
plantearse pruebas de bondad de ajuste a la distribucin normal (ji-cuadrado o KolmogorovSmirnov) y de homoscedasticidad (Bartlett).
El planteamiento habitual es considerar que, como todas ellas son normales con la misma
media (0) y la misma varianza ( 2), los residuos ( ) tambin tienen una distribucin
normal con media 0 y varianza desconocida 2 y, simplemente, contrastar este extremo.
Al conjunto de tcnicas que se usan para ello se le denomina anlisis de los residuos.
El anlisis de los residuos consiste, por tanto, en contrastar que , i=1,...,n provienen de
una poblacin normal con media 0 y varianza 2 con las pruebas habituales de ji-cuadrado,
Kolmogorov-Smirnov.
Hay que tener en cuenta que de este modo se estn contrastando globalmente todas las
asunciones y, por consiguiente, una falta de normalidad de los residuos puede ser debida
tambin a que el modelo sea inapropiado o a existencia de heterocedasticidad.
Teniendo en cuenta que (n-(k+1))s2/2 se distribuye como una ji-cuadrado con (n-(k+1))
grados de libertad, la variable
llamada residuo normalizado tendr una distribucin t de Student con (n-(k+1)) grados de
libertad, que para valores de n suficientemente grandes se puede aproximar a una normal
reducida (de media cero y varianza 1) y, a menudo, se contrasta la distribucin de esta
variable en lugar de el residuo.
Adems de estas pruebas de significacin para asegurar que globalmente se cumplen las
asunciones del modelo, es til realizar un anlisis grfico de los mismos que permite
discriminar entre distintas violaciones de las mismas. Si se representara en una grfica
bidimensional los residuos observados (eje Y) para cada una de las variables Y|x1,...,xk (eje
X) y se cumplieran las asunciones se observara una nube de puntos en direccin
horizontal y con anchura constante (la media de cada x1,...,xk debera ser cero y tener
todas la misma varianza). Como para cada variable Y|x1,...,xk el modelo produce la misma
estimacin una grfica de los residuos contra los valores predichos tendr el mismo
aspecto (fig. A).
Si se viola la linealidad se observar una falta de linealidad tambin en los residuos (fig. B),
si se viola la homoscedasticidad, la anchura de la banda no ser constante (fig. C), una
relacin lineal entre los residuos y las predicciones puede indicar que alguna variable no
incluida en el modelo puede ser significativa (fig. D).
Regrsein lineal con el PRESTA
Regresin lineal con el PRESTA

Con el PRESTA se puede realizar la regresin lineal simple con dos opciones: L
(regresin lineal) o R (regresin mltiple) que tienen diferentes prestaciones.
La opcin L puede leer las dos variables de diferentes archivos asumiendo que
estn en el mismo orden. Acepta variable de control, es decir permite leer slo
aquellos casos que cumplan alguna condicin con respecto a otra variable, por
ejemplo, si hay un archivo con 3 variables: SEXO, EDAD y PRESIS se pueden
hacer la regresin lineal de PRESIS y EDAD slo para los varones usando
SEXO como variable de control. Acepta que el archivo tenga datos no
especificados incluso en las variables a analizar (aunque obviamente no los
usa).
Produce tambin una grfica con los puntos, la recta de regresin y la banda de
confianza al nivel solicitado. Permite dividir la nube de puntos en varias zonas
(hasta un mximo de 5) y realizar regresiones distintas para cada zona como
una primera aproximacin a regresiones no lineales.
La opcin R, en cambio, exige que ambas variables estn en el mismo archivo,
no acepta archivos que contengan valores no especificados aunque sea en
otras variables distintas a las del anlisis y tampoco acepta variable de control.
No produce grfica y la salida contiene adems de los estadsticos de L, el
anlisis de la varianza de la regresin, la matriz de covarianzas de los
coeficientes de regresin y una lista con los residuos que se puede guardar en
otra variable del archivo.
Permite guardar en otra variable del archivo los residuos. Para crear los
residuos normalizados, hay que dividir esta variable por el error estndar de la
estimacin (s), con la opcin de operar con variables del men de Entrada y
Edicin de Datos.
Con esta misma opcin se pueden restar los residuos de la variable dependiente
para obtener los valores predichos y realizar con la opcin de grficas
bivariantes el anlisis grfico.
En el men de Entrada y Edicin de Datos existen las opciones de operar con
variables, que permite la creacin de una variable producto de otras dos, para
estudiar las interacciones y los trminos no lineales, creacin de variables
"dummy" que permite crear variables indicadoras con los tres esquemas
explicados en el texto y transformacin de variables que, entre otras, permite el
centrado de variables.
Adems, a partir de la versin 2.2, el PRESTA incluye una opcin con el
diagnstico de colinealidad. El programa pregunta el nombre del archivo y las
variables a estudiar.
Regrsein lineal con el PRESTA
Intro_errores
Errores en las mediciones y clasificaciones clnicas: Precisin y validez

V. Abraira
Introduccin
Todo proceso de medicin (proceso mediante el cual se cuantifica una magnitud) est amenazado por
diversas fuentes de error, derivadas tanto de las limitaciones del instrumento de medida, como de la
naturaleza de la magnitud a medir. Clsicamente se distingue entre el error debido a la precisin limitada
del instrumento que atenta a la reproducibilidad de la medicin introduciendo un error aleatorio en la
misma y el debido a la validez, tambin limitada, que introduce un error sistemtico, que en epidemiologa
se denomina sesgo. De modo esquemtico se puede decir que la validez depende exclusivamente del
instrumento y tiene que ver con la cuestin de si el mismo mide lo que debe medir, mientras que la
precisin depende tanto del instrumento como del proceso de medicin y tiene que ver con cunto se
aproxima la medida al valor real de la magnitud. En ambos casos es siempre cuestin de grado, no
existen instrumentos infinitamente precisos y vlidos, hay slo instrumentos ms precisos y/o vlidos que
otros. Al modo habitual de controlar la validez de un instrumento de medida se le denomina calibracin, y
consiste en comparar las medidas obtenidas con l con unos patrones de referencia (cuanto ms se
parezcan estas medidas al patrn, ms vlido es el instrumento), mientras que la manera de controlar la
precisin de un instrumento es comparar entre s medidas repetidas de un mismo objeto y evaluar el
grado de acuerdo entre ellas (cuanto ms se parezcan estas medidas entre s, ms preciso es).
En ciertas situaciones, en la prctica clnica entre ellas, el proceso de control de la precisin y validez de
una medida es ms complejo que el esbozado hasta aqu, debido a dos fenmenos inherentes a las
mismas y que, hasta ahora, no se han considerado. De un lado, las magnitudes a medir son aleatorias, es
decir presentan diversos grados de variabilidad impredecible propia. Si, por ejemplo, se trata de controlar
la precisin de la medicin de la presin arterial diastlica habra que repetir la medicin en un mismo
individuo varias veces y como la propia presin arterial es variable a lo largo del tiempo, el resultado se
vera afectado simultneamente por la variabilidad introducida por la precisin limitada del instrumento
(manmetro y observador) y la variabilidad propia de la presin arterial.
Por otro lado, adems de magnitudes tales como presin, temperatura, concentracin de hemoglobina en
sangre, etc., se trabaja con magnitudes como dolor, mejora en un proceso patolgico, grado pronstico
de una afeccin, etc., para las cuales no existe un patrn de referencia claro y objetivo ni escala mtrica
apropiada y que, por tanto, suelen describirse en escalas ordinales o, incluso, nominales, cuya
apreciacin puede estar muy distorsionada por influencias subjetivas. Estas magnitudes suelen
denominarse variables blandas (vase Feinstein) y dan lugar a clasificaciones mejor que a mediciones en
sentido estricto (que implica la existencia de una escala mtrica). Evidentemente, existen tambin
variables objetivas ("duras" en la jerga) que dan lugar a clasificaciones, por ejemplo muerto/vivo. Los
procesos de clasificacin sufren los mismos problemas de validez y precisin que los de medicin, pero
con ciertas complicaciones aadidas en el caso de las variables blandas. Para controlar su validez, no
suelen existir patrones de referencia, o no son tan objetivos o accesibles como en el caso de una
magnitud fsica. Por ejemplo, en la calibracin de las imgenes obtenidas por resonancia nuclear
magntica para diagnosticar lesiones de menisco, cul es el patrn de referencia adecuado? la visin
directa mediante artroscopia? es sta suficientemente objetiva, o tambin est influida por factores
subjetivos dependientes de la propia tcnica, de la experiencia del mdico que la realiza, de la diversidad
de meniscos "normales"? En este sentido se suele distinguir entre dos modos de controlar la validez de
un instrumento de medida (ntese que se est usando el trmino instrumento de medida en un sentido
muy amplio, en este ejemplo no es slo el "aparato" usado para obtener la imagen, sino el conjunto
formado por el aparato que produce la imagen y el observador que la interpreta, siendo, adems, ste
ltimo ms crtico para los errores de medicin-clasificacin): cuando se hace con patrones objetivos se
habla de exactitud ("accuracy" en la literatura clnico-epidemiolgica inglesa), mientras que cuando se
controla comparando simplemente con una referencia considerada mejor ("gold standard") se habla de
conformidad.
En cuanto a la reproducibilidad, sobre todo con mtodos de clasificacin, se distingue entre la
reproducibilidad del mismo instrumento (tpicamente un observador en este caso) en dos instantes de
tiempo diferentes y se habla de concordancia ("agreement" en la literatura en ingls) o consistencia
interna o intraobservador, por ejemplo un radilogo o un servicio de radiologa tomado como unidad,
clasifica igual la misma radiografa estudiada hoy y dos meses despus? y reproducibilidad del mismo
instrumento usado en diferentes condiciones, por ejemplo dos radilogos diferentes clasifican del mismo
modo la misma radiografa? se habla entonces de concordancia o consistencia externa o interobservador.
http://www.hrc.es/bioest/Intro_errores.html (1 of 2) [28/12/2002 20:22:46]
Intro_errores
Esquemticamente
Precisin o
concordancia intraobservador
reproducibilidad o
concordancia interobservador
concordancia
exactitud
Validez
conformidad
Referencias
Feinstein A.R. (1987) Clinimetrics. Yale University Press. New Haven.
http://www.hrc.es/bioest/Intro_errores.html (2 of 2) [28/12/2002 20:22:46]
Indices de concordancia
ndices de concordancia
Caso ms sencillo: 2 observadores y variable dicotmica.
Ejemplo: dos radilogos independientes informan como neumona s/no 100 radiografas. Los
resultados son
Radilogo A
Rad. B
Pulmona
No pulmona
Total
Pulm.
10
No
10
80
90
Total
14
86
100
En general
Observador A
Obs. B
Positivo
Negativo
Total
Positivo
Negativo
Total
siendo N el nmero total de individuos observados, a el nmero de ellos al que ambos

observadores clasifican como positivo, etc.
Existen varios ndices de concordancia propuestos, el ms obvio es la proporcin de acuerdos
observados, es decir (a + d)/N. Este ndice es muy intuitivo y fcilmente interpretable: tomar
valores entre 0 (total desacuerdo) y 1 (mximo acuerdo). Sin embargo como indicador de
reproducibilidad tiene el inconveniente de que aun en el caso de que los dos observadores
clasifiquen con criterios independientes se producira un cierto grado de acuerdo por azar. Por
ejemplo, si se tiran dos dados y se registra si sale un cierto nmero, p.e. el dos (resultado
positivo) u otro cualquiera (resultado negativo), en un cierto nmero de veces (con una
probabilidad de 26/36, para ser ms preciso, siguiendo el razonamiento que se hace ms
abajo) ambos dados producirn el mismo resultado por azar. Es deseable que un ndice de
concordancia tenga en cuenta este hecho y que, de algn modo, indique el grado de acuerdo
que existe por encima del esperado por azar. En este sentido, el ndice ms usado es el
propuesto por Cohen y denominado ndice kappa () que se define como
http://www.hrc.es/bioest/errores_2.html (1 of 3) [28/12/2002 20:23:26]
siendo Po la proporcin de acuerdos observados y Pe la proporcin de acuerdos esperados en

la hiptesis de independencia entre los observadores, es decir de acuerdos por azar. A partir
de la tabla
para calcular Pe hay recordar que dos sucesos A1, A2 son independientes si p(A1
A2)=p(A1)p(A2). En este caso, si llamamos A1 al suceso "el observador A clasifica un individuo
como positivo" y A2 al suceso "el observador B clasifica un individuo como positivo" el suceso
A1 A2 ser "ambos observadores clasifican un individuo como positivo"; como el observador
A ha clasificado t individuos como positivos y el B ha clasificado r, la mejor estimacin de p(A1)
es t/N y la de p(A2) es r/N, por lo tanto la mejor estimacin de la probabilidad de que ambos
clasifiquen como positivo a un individuo, en la hiptesis de que ambos son independientes es
su producto, es decir rt/N2; por la misma razn, la probabilidad de que ambos clasifiquen como
negativo a un individuo por azar es su/N2, en consecuencia
Cuando hay acuerdo total b=c=0, por lo tanto el valor de Po es 1 y en consecuencia el ndice
tambin vale 1 para el mximo acuerdo; si el acuerdo observado es igual al esperado por azar,
vale 0. Obsrvese que si el acuerdo observado es menor que el esperado por azar, el ndice
toma valores negativos. Un modo intuitivo de interpretar este ndice puede hacerse
despejando Po de la definicin
si se piensa que la proporcin de acuerdos observados (Po) es un valor intermedio entre el

mximo acuerdo posible (1) y la proporcin de acuerdos esperados por azar (Pe), se puede
interpretar como el peso que el mximo acuerdo posible tiene en los acuerdos observados.
En el ejemplo la proporcin de acuerdos observados es
es decir, ambos radilogos coinciden en un 84% de las radiografas. Ahora bien, el acuerdo
esperado por azar es
por lo tanto
es decir, el grado de acuerdo una vez corregido el debido al azar es mucho ms modesto que
lo que indicaba el 84% de acuerdo "crudo". Segn la interpretacin anterior, el acuerdo
observado est compuesto por un 24,5% del acuerdo mximo y un 75,5% del esperado por
azar.
Landis y Koch propusieron, y desde entonces ha sido ampliamente usada, la siguiente escala
de valoracin del
kappa
grado de acuerdo
< 0,00
sin acuerdo
0,00 - 0,20
insignificante
0,21 - 0,40
discreto
0,41 - 0,60
moderado
0,61 - 0,80
sustancial
0,81 - 1,00
casi perfecto
Referencias
Cohen J. (1960) A coefficient of agreement for nominal scales. Educ Psychol Meas 20:37-46.
Landis J.R., Koch G.G. (1977) The measurement of observer agreement for categorical data.
Biometrics 33:159-174.
Latour J., Abraira V., Cabello J.B., Lpez Snchez J. (1997) Mtodos de investigacin en
cardiologa clnica (IV). Las mediciones clnicas en cardiologa: validez y errores de medicin.
Rev Esp Cardiol 50:117-128.
Problemas del ndice kappa
Problemas del ndice kappa ()

No obstante su alto grado de aceptacin en la literatura clnico-epidemiolgica, debe tenerse en
cuenta que la escala anterior de valoracin del ndice , como los propios autores resaltan, es
arbitraria y que, adems, el valor del ndice no slo depende de los acuerdos observados, sino
tambin de los esperados y, en consecuencia, pueden darse diversos efectos poco intuitivos. En
primer lugar, el valor de depende de la prevalencia del carcter observado. En el ejemplo, la
prevalencia de pulmona es baja: el radilogo A diagnostica un 14% de pulmonas y el B un 10%.
Si los resultados hubieran sido
Rad. A
Rad. B
30
10
54
36
40
donde las prevalencias respectivas son 40% para A y 36% para B, con la misma proporcin de
acuerdos observados (84%) el ndice hubiera sido 0,661. En general, cuanto ms cercana a 0,5
sea la prevalencia (cuanto ms balanceados estn los totales marginales en la tabla) mayor es el
para igual proporcin de acuerdos observados, dicho de otro modo, prevalencias muy bajas, o
muy altas, penalizan el ndice , debido a que en ese caso la proporcin de acuerdos esperados
por azar es mayor que cuando la prevalencia es cercana a 0,5. Por otro lado, ste tambin se ve
afectado por la simetra de los totales marginales.
Considerese, por ejemplo, las tablas
Rad. B
Tabla 1
Tabla 2
Rad. A
Rad. A
45
15
25
15
60
70
25
35
35
60
30
en ambas la proporcin de acuerdos observados es la misma (0,60) y tambin es la misma la

prevalencia observada por el radilogo B (0,60), sin embargo la del radilogo A es 0,70 en la tabla
1 y 0,30 en la 2, por lo tanto hay mayor desacuerdo entre las prevalencias observadas en la tabla
2, aunque en ambos casos estn igualmente alejadas de 0,5, es decir, tienen la misma falta de
balanceo en los marginales, aunque en la tabla 1 de modo simtrico con respecto a ambos
observadores (en ambos son mayores de 0,5) y asimtricamente en la 2 (para A es menor de 0,5
y para B mayor). El ndice vale 0,13 en la tabla 1 y 0,26 en la 2. En general, la simetra en la falta
de balanceo en los totales marginales tambin penaliza el ndice y tanto ms, cuanto ms
"perfecta" (la misma diferencia con respecto a 0,5) sea la misma. Dicho de otro modo, en igualdad
de acuerdos observados, cuanto mayor sea la diferencia entre las prevalencias observadas por
cada observador mayor es el ndice .
Problemas del ndice kappa
En consecuencia, para interpretar el ndice es necesario contar, tambin con el valor de las
frecuencias marginales de la tabla (prevalencias observadas por cada observador).
El pequeo valor de para los datos del ejemplo (mediano en la escala de Landis y Koch) es
"explicado" a la luz de los efectos anteriores por el hecho de que estamos en la peor de las
situaciones posibles: baja prevalencia, y similar, en ambos observadores o, en la terminologa
anterior totales marginales "desbalanceados" con casi perfecta simetra.
Referencias
Feinstein A.R., Cicchetti D.V. (1990) High agreement but low kappa: I. The problem of two
paradoxes, J Clin Epidemiol 43: 543-549.
Clasificaciones multinomiales
Si bien las clasificaciones binomiales son muy frecuentes, a menudo en clnica resultan insuficientes. P.e. un
psiquiatra clasifica los trastornos de los pacientes en psicticos, neurticos u orgnicos, o un reumatlogo clasifica
las artritis en leves, moderadas o graves. Ambas clasificaciones son multinomiales (tres categoras), no obstante
existe una diferencia entre ellas, las categoras en el caso de la artritis pueden ordenarse de un modo relevante para
el problema: una artritis grave es ms que una moderada, y sta ms que una leve, mientras que para la
clasificacin psiquitrica este orden no existe. A las variables multinomiales que tienen implcito un orden se les
denomina ordinales y a las que no, nominales. Para estudiar la precisin de una clasificacin multinomial, hay ciertas
diferencias segn que sta sea ordinal o nominal.
Como en las clasificaciones binarias, los resultados de un estudio de concordancia se pueden resumir en una tabla
de doble entrada, aunque ahora con K filas y K columnas, siendo K el nmero de categoras de la clasificacin.
La notacin usada en esta tabla es: para identificar una celda se usan dos subndices: el primero para la fila y el
segundo para la columna, por lo tanto Xij es el nmero de individuos que el observador B ha clasificado en la
categora i y el observador A en la j.
Observador A
Obs. B
Cat. 1
Cat. 2
...
Cat. K
Total
Cat. 1
X11
X12
...
X1K
X1.
Cat. 2
X21
X22
...
X2K
X2.
...
Cat. K
XK1
XK2
...
XKK
XK.
Total
X.1
X.2
...
X.K
Para indicar los totales marginales se usa un punto en el lugar del subndice con respecto al que se ha sumado: Xi.
es la suma de la fila i y X.j es la suma de la columna j. En notacin algebraica
Para una clasificacin multinomial se puede definir un ndice kappa idntico al anterior, generalizando el clculo de
Po y Pe como
Ejemplo: Dos reumatlogos clasifican en tres categoras (leve, moderada, grave) 80 enfermos con artritis. Los
resultados son
Reumatlogo A
Reum. B
Leve
Mode.
Grave
Leve
20
Moderada
29
43
Total
Grave
14
17
Total
18
40
22
80
Otra alternativa para estudiar concordancia entre clasificaciones multinomiales consiste en definir un ndice kappa
para cada una de las categoras, colapsando la tabla KxK original en K tablas 2x2 en las que se compara cada
categora con todas las dems. De este modo se puede estudiar la contribucin de cada una de ellas a la
concordancia de la clasificacin.
Para los datos del ejemplo, se colapsara la tabla en 3 tablas: una comparando la categora leve con las dems, otra
la moderada con las dems y la tercera la grave con las otras.
Obs B
Obs A
Obs A
Obs A
11
51
29
14
11
26
14
55
L: leve, M: moderada, G:grave, O:otra.

calculando en cada una de estas tablas Po, Pe y resulta:
Po
Pe
0,75
0,638
0,309
0,688
0,5
0,376
0,863
0,629
0,631
tabla
donde se observa que la clasificacin de la categora grave es la que mayor produce (Cmo se interpreta?).
ndice kappa con "pesos"

Una solucin que puede verse como intermedia entre las anteriores (un nico kappa global o K
kappas individuales para cada categora), pero que, en general, slo tiene sentido para
variables ordinales, es el denominado kappa ponderado, tambin propuesto por Cohen, en el
cual se asignan unos pesos para cuantificar la importancia relativa entre los desacuerdos.
Pensando en el ejemplo anterior, no tiene la misma importancia un desacuerdo en la
clasificacin entre las categoras leve y moderada que entre leve y grave, obviamente la ltima
representa un mayor desacuerdo que la primera.
La idea de este ndice ponderado es asignar a cada celda de la tabla un peso wij comprendido
entre 0 y 1 que represente la importancia del desacuerdo. Dando el mximo peso al acuerdo
perfecto, y pesos proporcionalmente menores segn la importancia del desacuerdo
adems, obviamente wij = wji.

Las proporciones ponderadas de acuerdos observados y esperados se definen
y a partir de aqu, el kappa ponderado
Ntese que, en el caso extremo, si se definen los pesos como
el kappa ponderado coincide con el kappa global.

La principal ventaja del kappa ponderado reside en la posibilidad de cuantificar diferentes
grados de desacuerdo. Los valores de los pesos dependern, en cada caso, de la importancia
que se conceda a cada desacuerdo, hay que tener presente, sin embargo, que ello aade
cierta dificultad a su interpretacin: si en dos estudios diferentes, se calcula el kappa
ponderado con dos sistemas de pesos distintos, es difcil realizar comparaciones entre ellos.
Los ms usados en este sentido son, por su sencillez, los denominados pesos lineales,
propuestos inicialmente por Cohen
y los denominados pesos bicuadrados, propuestos posteriormente por Fleiss y Cohen
Pesos lineales y bicuadrados para 3 categoras
Peso
lineal (wl)
bicuadrado (wb)
Obs.
Cat
1/2
3/4
1/2
1/2
3/4
3/4
1/2
3/4
Para los datos del ejemplo de los reumatlogos los kappas usando estos sistemas de pesos
son respectivamente
, ms altos que sin pesos.
Mltiples observadores
Este ndice se puede extender a mltiples observadores, con lo que las frmulas se complican
pero sin apenas cambios conceptuales.
Referencias
Cohen J. (1968) Weighted kappa: Nominal scale agreement with provision for scaled
disagreement or parcial credit Psychol Bull 70: 213-220.
Distribucin muestral del kappa
Distribucin muestral del ndice

El ndice se calcula a partir de muestras, por tanto se obtiene slo una estimacin del
verdadero valor del en la poblacin. Es necesario estudiar su distribucin muestral para
poder construir intervalos de confianza y realizar contrastes de hiptesis.
En el caso de dos observadores clasificando en K categoras, en la hiptesis de
independencia, se puede demostrar que la varianza del kappa estimado es
y si se cumplen las condiciones de aproximacin de la binomial a la normal, el estadstico

se distribuye como una normal tipificada y puede usarse para contrastar la H0: = 0
con una regin crtica para un contraste lateral z > z
Ejemplo: Realizar el contraste de hiptesis H0: = 0 para los datos del ejemplo de los
reumatlogos. Segn la tabla
P.1=18/80=0.225 P.2=40/80=0.5
P.3=22/80=0.275 P1.=20/80=0.25
P2.=43/80=0.5375 P3.=17/80=0.2125
Pe=0.383
por lo tanto
y no se puede rechazar la hiptesis nula de = 0.

En general, sin embargo, estos contrastes no tienen mucho inters. El objetivo de un estudio
de concordancia no es tanto contrastar si hay ms acuerdo que el esperado en la hiptesis de
independencia sino cuantificar el mismo. Si un estudio produce un = 0,1 aunque sea
significativamente distinto de 0, revela un acuerdo insignificante. Lo que tiene inters es, por
tanto, la estimacin por intervalos. Aqu debe sealarse que la varianza anterior se ha obtenido
en la hiptesis de independencia entre observadores en cuyo caso =0, y consecuentemente
no sirve para construir intervalos de confianza en la hiptesis de no independencia. En esta
hiptesis se puede demostrar que
Distribucin muestral del kappa
siendo
y a partir de esta varianza, un intervalo de confianza aproximado, usando la normalidad

asinttica de la distribucin de
, con un nivel de confianza de 100(1 - )% es
Tambin hay frmulas, que os ahorro, para la varianza del kappa ponderado. Para el caso de
mltiples observadores, aunque hay algunas aproximaciones parciales, no existe todava una
frmula de uso general para la estimacin de su varianza, y se suele usar una tcnica muy
general para construir intervalos de confianza para estadsticos de distribucin muestral
desconocida que es la denominada "tcnica jackknife", introducida por Quenouille y que se
puede aplicar al ndice kappa.
Referencias
Abraira V., Prez de Vargas A. (1999). Generalization of the kappa coefficient for ordinal
categorical data, multiple observers and incomplete designs. Qestii 23: 561-571
Clculo del kappa con el PRESTA
Clculo del kappa con el Presta

El Presta calcula el ndice kappa en dos procesamientos: Tablas de contingencia (G) y Anlisis
de concordancia (3). En la primera: slo para dos observadores, no admite pesos, calcula el
error estndar con las frmulas dadas aqu y se pueden codificar libremente las categoras, en
la segunda: acepta varios observadores, se pueden usar los pesos que se deseen (ofrece por
defecto los bicuadrados), calcula el error estndar por la tcnica jackknife y obliga a codificar
las categoras con nmeros enteros consecutivos (1,2,...).
http://www.hrc.es/bioest/errores_7.html [01/01/2003 23:20:29]
Concordancia para variables continuas

Aunque en la literatura clnica hay una gran tradicin de usar el coeficiente de correlacin lineal (r) para evaluar la
concordancia entre variables continuas, ello es incorrecto: dicho coeficiente mide la correlacin y no la
concordancia: si, p.e. un aparato para medir una magnitud produce sistemticamente el triple de otro aparato que
supuestamente mide la misma magnitud, ambas mediciones estn perfectamente correlacionadas (r=1) pero no
son concordantes en absoluto.
Ejemplo: en 1979, en un artculo de gran impacto entre neumlogos (Thorax,34:807-809), se comparaba las
medidas de flujo respiratorio mximo obtenidas por el aparato estndar (Wright) con las obtenidas por otro porttil
(miniWright). Los autores hacen hincapi en que ambas medidas se correlacionaban muy bien (r=0,992) y
proponen el uso alternativo del porttil. Como veremos enseguida las cosas no eran tan claras.
El ndice ms establecido para variables continuas es el denominado coeficiente de correlacin intraclase que se
calcula a partir de los estadsticos que produce un anlisis de la varianza y que, por tanto, no estamos en
condiciones de abordar en este curso.
Un procedimiento, grfico, alternativo propuesto por Altman e ilustrado con datos del estudio anterior es el
siguiente:
Paciente Wright MiniWright Diferencia Media
(l/min) (l/min)
1
494
512
-18
503.0
395
430
-35
412.5
516
520
-4
518.0
434
428
431.0
476
500
-24
488.0
557
600
-43
578.5
413
364
49
388.5
442
380
62
411.0
650
658
-8
654.0
10
433
445
-12
439.0
11
417
432
-15
424.5
12
656
626
30
641.0
13
267
260
263.5
14
478
477
477.5
15
178
259
-81
218.5
16
423
350
73
386.5
17
427
451
-24
439.0
Si calculamos el coeficiente de correlacin lineal

P R E S T A PC V2.2
23-MAR-1995
REGRESION LINEAL
X = wright MWRIGH
Y = wright WRIGHT
NO. DE PUNTOS
17
COEF. CORRELACION
.943
COEF. DETERMINACION
.890
ERROR ESTANDAR DE LA ESTIMA
39.882
Ecuacin de la recta
Y = .970 X + 11.482
La propuesta de Altman es presentar las diferencias contra la media.
donde se observa que las mediciones no son tan concordantes como pareca en la grfica anterior.
La media de las diferencias es de -2.1 l/min, es decir hay un error sistemtico "hacia abajo" por parte del
miniWright. Los lmites de concordancia son los lmites de confianza de esta diferencia, para calcularlos se calcula
la desviacin tpica de la diferencia, en este caso 38,8 y como t17 =2,11, los lmites de concordancia son 79,3 y 83,5, es decir con un 95% de probabilidad la medicin del miniWright puede ser 83,5 por debajo o 79,3 por arriba
de la media de ambas es esto aceptable clnicamente?
Notar que en la grfica, las diferencias se mantienen homogneas a lo largo del eje X. Si no fuera as, este mtodo
no se puede usar.
Puesto que estamos trabajando con una muestra, se deben tambin calcular los lmites de confianza para dichos
lmites de concordancia. El error estndar para estos lmites es aproximadamente

En nuestro caso para el lmite inferior seran -114,3 y -45,1 y para el superior 40,9 y 110,1.
Referencias
Bland J.M., Altman D.G. (1986) Statistical methods for assessing agreement between two methods of clinical
measurement. Lancet i: 307-310.
Latour J., Abraira V., Cabello J.B., Lpez Snchez J. (1997) Mtodos de investigacin en cardiologa clnica (IV).
Las mediciones clnicas en cardiologa: validez y errores de medicin. Rev Esp Cardiol 50:117-128.
ndices de validez
ndices de validez
Se trata, en esta clase, de procedimientos para evaluar la validez, es decir cunto se aproxima
una medida al valor real que pretende medir. Son procedimientos muy generales, pero aqu se
van a tratar al hilo del problema de las pruebas diagnsticas (problema muy importante en la
prctica y la investigacin clnica): pruebas para determinar si un individuo tiene, o no, una
cierta enfermedad (u otra caracterstica). Hay que resaltar (y no siempre se hace) que si bien
la validez de una prueba depende exclusivamente de la prueba, las estimaciones numricas
que se obtengan de la misma pueden depender de la prevalencia y de las caractersticas
clnicas de los pacientes que se hayan estudiado.
Empezemos por el caso ms sencillo: una prueba cuyos resultados posibles son "positivo" o
"negativo". Para evaluar su validez habr que aplicarla a una muestra de individuos que
sepamos que tienen la enfermedad y a otra que sepamos que no la tiene. Los resultados se
pueden expresar en una tabla como la siguiente:
Estado
Prueba
No Enfer.
Enfermo
Total
Negativo
Positivo
Total
siendo N el nmero total de individuos observados, t el nmero de no enfermos, u el de

enfermos, a el nmero de no enfermos en que la prueba ha dado negativa, etc.
Si la prueba fuera perfectamente vlida b=c=0. Como ndices de validez se definen:
Sensibilidad o proporcin de verdaderos positivos como la probabilidad de que la prueba d
positivo condicionada a que el individuo est enfermo y Especificidad o proporcin de
verdaderos negativos como la probabilidad de que la prueba d negativo condicionada a que
el individuo no est enfermo. Tambin se usan como ndices de error sus complementarios, es
decir proporcin de falsos positivos y de falsos negativos.
A partir de la tabla, estos ndices (que tomarn valores entre 0 y 1) se estiman como:
Sen = d/u
Esp = a/t
PFP = c/t = 1 - Esp
PFN = b/u = 1 - Sen
Como son proporciones, sus I.C. se construyen como tal, es decir, p.e. para la sensibilidad y
asumiendo muestras grandes (0,05 < Sen < 0,95):
Ejemplo: Evaluacin de la gammagrafa de perfusin en el diagnstico de embolismo pulmonar
http://www.hrc.es/bioest/validez_1.html (1 of 3) [01/01/2003 23:23:36]
ndices de validez
(datos tomados de McNeil). Uno de los problemas de estos estudios es la definicin del "gold
standard". En ste, se us la arteriografa pulmonar
Estado
Prueba
No Enfermo
Enfermo
Total
Negativo
Positivo
78
54
132
Total
80
54
134
Sen = 54/54 =1 Esp = 2/80 =0,02

Es una prueba extraordinariamente sensible (en todos los enfermos da positivo) pero muy
inespecfica (tambin da positivo en muchos individuos no enfermos). Es una situacin
extrema de un hecho habitual.
Es razonable usar esta prueba? Depende del contexto clnico. Hay otros ndices que ayudan
en esta decisin: los llamados valores predictivos:
VP+=p(enfermo|prueba+)=d/s
VP-=p(no enfermo|prueba-)=a/r
Para el ejemplo
VP+=54/132= 0,41 y VP-=2/2=1
que ponen de manifiesto que podra ser una muy buena prueba para descartar un diagnstico
de EP, pero mala para confirmarlo.
Hay que tener en cuenta que estas probabilidades postprueba corresponden a la probabilidad
preprueba del estudio 54/134=0,40 y no seran aplicables a otras situaciones. Sin embargo, el
teorema de Bayes permite calcular los valores predictivos a partir de la sensibilidad y
especificidad (que slo dependen de la prueba) para distintas probabilidades preprueba.
siendo p(E) la probabilidad preprueba y similarmente
Ejemplo: Calcular los VP+ y VP- de la gammagrafa de perfusin para un paciente cuya
probabilidad preprueba es de 0,7
ndices de validez
es decir, no obtenemos ninguna informacin si la prueba da positivo.
sin embargo, si da negativa estamos seguros de que no tiene la enfermedad (porque la prueba
tiene Sen=1). Observar que el VP- es igual que el calculado antes para una probabilidad
preprueba de 0,4 sin embargo el VP+ es distinto.
Referencias
Cabello J.B., Pozo F. (1997) Mtodos de investigacin en cardiologa clnica (X). Estudios de
evaluacin de las pruebas diagnsticas en cardiologa. Rev Esp Cardiol 50:507-519.
McNeil B.J. (1980) Ventilation-perfusion studies and the diagnosis of pulmonary embolism:
concise communication. J Nucl Med. 21: 319-23.
Cocientes de probabilidades
Cocientes de probabilidades:
Se trata de buscar ndices que engloben la sensibilidad y la especificidad. Se definen los
cocientes de probabilidades (likelihood ratio) positivo y negativo como:
Qu informacin dan? Segn el teorema de Bayes
dividiendo [1] por [2]
es decir, si la prueba da positivo, el odds postprueba es igual al odds preprueba multiplicado

por el cociente de probabilidades positivo:
Similarmente:
si la prueba da negativo, el odds postprueba es tambin igual al odds preprueba multiplicado

por el cociente de probabilidades negativo:
si el cociente de probabilidades para un resultado (+ -) es 1, dicho resultado no aade

ninguna informacin y cuanto ms alejado est de 1, ms informacin aade.
Para la gammagrafa de perfusin:
es decir: un resultado positivo apenas aade informacin, mientras que uno negativo da toda
la informacin (si el resultado es negativo, la odds postprueba es 0, la probabilidad postprueba
es 0) Cul sera la probabilidad postprueba de un paciente con una probabilidad prepueba de
Cocientes de probabilidades
0,1 si la prueba es positiva?
No hemos ganado prcticamente nada, como informa el valor de CP+ tan prximo a 1.
Ventajas de usar los CP:
- No cambian con la probabilidad preprueba.
- Permiten calcular la probabilidad postprueba.
- Son fcilmente generalizables.
Ultimamente se ha descrito otro ndice denominado efectividad de la prueba, cuya distribucin
es aproximadamente normal, que se define como
y que puede interpretarse como la diferencia entre las medias de los resultados entre una
poblacin de enfermos y otra de sanos en una escala normalizada. Si =1 la prueba no es
efectiva y si =3 es altamente efectiva.
Referencias
Hasselband V., Hedges L. (1995). Meta-analysis of diagnostics test. Psychol Bull 117: 167-178
Intervalos de confianza para los CP
Intervalos de confianza para los CP

Cun fiables son los CP calculados sobre muestras? Necesitamos calcular su intervalo de
confianza que no es fcil para cocientes de probabilidades. Hay varios mtodos aproximados
para muestras grandes.
a) Si el CP es prximo a 1 (mtodo de Miettinen)
siendo 2 el estadstico de asociacin de la tabla 2x2

Ejemplo: para el CP+ de los datos de la gammagrafa.
Calculamos el 2 de la tabla: 2=0,2 por tanto el intervalo de confianza al 95% es
b) en caso contrario (aproximacin de primer orden del desarrollo de Taylor)
siendo a, b, c y d los valores de las celdas de la tabla anterior. Obsrvese que para CP=0 el
intervalo de confianza es siempre 0.
http://www.hrc.es/bioest/validez_3.html [01/01/2003 23:28:14]
Tablas Kx2
Tablas Kx2
Los ndices calculados sobre tablas 2x2 tienen la ventaja de su sencillez, sin embargo,
raramente una prueba diagnstica se puede resumir en slo dos resultados. Por ejemplo, los
datos originales del ejemplo de la gammagrafa son:
Enfermo
Prueba
No
Total
Negativo
Indeter.
22
13
35
pulmonar
lobular
segmentario
subsegmentario
pulmonar
lobular
22
27
segmetario
16
22
38
subsegmentario
41
44
102
67
169
Defecto nico
Defectos
mltiples (el
mayor)
Total
En la tabla presentada antes se haban eliminado los indeterminados (35 casos) y se haban
agrupado todos los defectos de perfusin en la categora "positivo", lo que parece una
simplificacin excesiva.
Se pueden extender, sin dificultad, los ndices anteriores a pruebas con varios niveles. Sea,
p.e, una tabla 4x2
Enfermo
Prueba
No
Nivel 1
Tablas Kx2
Nivel 2
Nivel 3
Nivel 4
Total
Se puede definir una sensibilidad para cada nivel como la probabilidad de que la prueba
resulte en ese nivel condicionada a que el individuo est enfermo, y especificidad para cada
nivel como la probabilidad de que la prueba no resulte en ese nivel condicionada a que el
individuo no est enfermo. A partir de la tabla, la estimaciones de la sensibilidad y
especificidad, p.e. para el nivel 2 son
se define tambin el cociente de probabilidades para cada nivel como la sensibilidad de ese
nivel dividido por uno menos la especificidad, p.e. para el nivel
estos CP se interpretan del mismo modo, es decir el odds postprueba es el odds preprueba
multiplicado por el CP del nivel que resulte y los IC se calculan de la misma manera.
Ejemplo: Para la gammagrafa, agrupando en 4 categoras, calcular la sensibilidad,
especificidad y cociente de probabilidades para cada nivel. Calcular, tambin, la probabilidad
postprueba para cada uno de los niveles de un paciente cuya probabilidad preprueba sea 0,6.
Enfermo
Prueba
No
Total
Negativo
Indeterminado
22
13
35
Defecto nico
14
18
Defectos mltiples
64
50
114
Total
102
67
169
Tablas Kx2
Los ndices son:
Nivel
Sen
Esp
CP
0/67 = 0
100/102 = 0,980
Indeterminado
13/67 = 0,194
80/102 = 0,784
0,900
Defecto nico
4/67 = 0,060
88/102 = 0,863
0,435
Defectos mltiples
50/67 = 0,746
38/102 = 0,373
1,189
Negativo
Para un paciente con una probabilidad preprueba de 0,6, el odds preprueba es 0,6/0,4=1,5.
Nivel
Oddspos
ppos
Indeterminado
1,347
0,574
Defecto nico
0,655
0,396
Defectos mltiples
1,784
0,641
Negativo
Es decir, dentro de los resultados "positivo" de antes, el defecto nico es el de mayor poder
informativo.
Ejemplo: Calcular los IC al 95% para los ndices anteriores.
Para la sensibilidad y especificidad usamos la frmula estndar, aunque para el resultado
negativo estamos fuera de las condiciones de aproximacin, por ejemplo para Espneg
los resultados para todos los ndices son
Nivel
Sen
Esp
Negativo
0-0
0,953 - 1,007
Indeterminado
0,099 - 0,289
0,704 - 0,864
Defecto nico
0,003 - 0,117
0,796 - 0,930
Tablas Kx2
Defectos mltiples
0,642 - 0,850
0,279 - 0,466
Las frmulas para los IC de los CP se generalizan, para cada nivel:
por ejemplo, para el nivel indeterminado
y los resultados para todos los niveles
Nivel
Negativo
IC
0-0
Indeterminado
0,487 - 1,657
Defecto nico
0,150 - 1,265
Defectos mltiples
0,969 - 1,459
Es decir, salvo el del nivel negativo, ninguno de los CP es significativamente distinto de 1.
Ms de dos enfermedades
Estos ndices se pueden generalizar a pruebas diagnsticas diferenciales de ms de 2
enfermedades. Ejemplo: el tacto rectal en caso de dolor abdominal agudo para diferenciar
entre apendicitis, pancreatitis y dolor no especfico. Sea la tabla
Desenlace
Tacto rectal
Apendicitis
Pancreatitis
No especfico
Total
Positivo
200
130
338
Negativo
60
30
120
210
Dudoso
40
12
400
452
Total
300
50
650
1000
La sensibilidad del tacto rectal positivo para la apendicitis ser 200/300=0,666 y su

especificidad (30+120+12+400)/(50+650) = 0,803 por tanto el cociente de probabilidades del
tacto rectal positivo para la apendicitis es 0,666/(1-0,803)=3,35 y del mismo modo se calculan
para los dems. Se define tambin, y es ms til, el cociente de probabilidades relativo de una
enfermedad i respecto a otra j para un resultado Rk como el cociente de sus sensibilidades.
Para calcular probabilidades postprueba en un entorno donde las probabilidades preprueba

sean diferentes se usa el Teorema de Bayes
siendo Rk el resultado obtenido en la prueba, Ei las distintas enfermedades y p(Rk|Ei) las

sensibilidades para ese resultado y, a partir de aqu, de un modo similar a como se hizo antes
(el desarrollo completo puede verse en Birkett NJ (1988)).
Ejemplo 5 Con los CP del tacto rectal obtenidos de la tabla anterior, calcular la probabilidad
postprueba de apendicitis para un individuo con tacto rectal positivo y cuyas probabilidades
preprueba son: p(A)=0,30; p(P)=0,05 y p(NE)=0,65
Necesitamos estimar, a partir de la tabla, las sensibilidades de cada enfermedad para el tacto
rectal positivo
los cocientes de probabilidad relativos
y usando la frmula anterior
por lo tanto
es decir, si el tacto rectal es positivo, hemos pasado de una probabilidad preprueba de 0,30 a
una probabilidad postprueba de 0,59.
El clculo de los IC para estas probabilidades escapa del objetivo de este curso, pero se
pueden ver en Monsour M.J.; Evans A.T, Kupper L.L. (1991).
Referencias
Birkett N.J. (1988) Evaluation of diagnostic tests with multiple diagnostic categories. J Clin
Epidemiol 41:491-494
Monsour M.J., Evans A.T., Kupper L.L. (1991) Confidence intervals for post-test probability.
Stat Med (1991), 10: 443-456.
Clculo de sensibilidad y especificidad con el PRESTA

El PRESTA calcula la sensibilidad, la especificidad y los CP con sus IC's para tablas 2xK, en la opcin
de "Anlisis de validez de pruebas diagnsticas (5)" Calcula tambin probabilidades postprueba
correspondientes a distintas probabilidades preprueba.
Tambin est disponible una calculadora que hace los mismos clculos a partir de la tabla, en lugar de
los datos crudos.
La salida para el ejemplo de la gammagrafa con 4 niveles es
P R E S T A PC V2.2 24-MAR-2000
ANALISIS DE VALIDEZ DE PRUEBAS DIAGNOSTICAS
ARCHIVO gamma7
Los nmeros entre parntesis son porcentajes respecto a la suma de cada columna
Var:
ENFER
GAMMA
0:0
1:1
2( 2)
0( 0)
1:1
22( 22)
13( 19)
2:2
14( 14)
4( 6)
3:3
64( 63)
50( 75)
4:4
Nivel
Sensibilidad
Especif.
CP
.000
.980
.000
.194
.784
.900
.060
.863
.435
.746
.373
1.189
Intervalos de confianza al 95%

Nivel
Sensibilidad
Especif.
CP
.000
.054
.931
.995
.000
.000
.117
.304
.704
.864
.488
1.660
.023
.144
.796
.930
.150
1.265
.631
.835
.279
.466
.969
1.459
PROBABILIDADES POSTPRUEBA CORRESPONDIENTES A LA Ppre: .3000

Nivel
Probabilidad
.0000
.2783
.1571
.3376
Nota: Las diferencias entre las estimaciones de los IC para la Sensibilidad y Especificidad de esta
"salida" y del texto anterior son debidas a que en el texto se us la aproximacin normal y el PRESTA
no la usa si N<100 y los ndices <0,05 >0,95 en cuyo caso usa la aproximacin de Wilxon.
Curvas ROC
Curvas ROC
En la clase anterior se consider que el resultado de las pruebas diagnsticas era categrico,
sin embargo muchas pruebas producen resultados continuos, p.e. nivel de glucosa en sangre
para diagnosticar la diabetes. El comportamiento de dichas pruebas depende de donde se
ponga el punto de corte y lo habitual es que exista un grado variable de solapamiento en la fdp
de la variable resultado. En el caso de la glucosa la situacin se esquematiza en la grfica
Si se desplaza el punto de corte a la derecha (valores mayores de glucosa) disminuyen los

falsos positivos (regin azul) pero aumentan los falsos negativos (regin roja) o, en otros
trminos, disminuye la sensibilidad y aumenta la especificidad e inversamente si se desplaza a
la izquierda, de modo que un problema en estas pruebas es la seleccin del punto de corte
ptimo. Para caracterizar su comportamiento se usan las llamadas curvas ROC (Receiver
Operating Characteristic) desarrolladas por los operadores de radar e introducidas en la
investigacin clnica por los radilogos (Hanley y McNeil): son curvas en las que se presenta la
sensibilidad en funcin de los falsos positivos (complementario de la especificidad) para
distintos puntos de corte.
Informacin contenida en la curva:

- Si la prueba fuera perfecta, es decir, sin solapamiento, hay una regin en la que cualquier
punto de corte tiene sensibilidad y especifidad iguales a 1: la curva slo tiene el punto (0,1).
http://www.hrc.es/bioest/roc_1.html (1 of 4) [02/01/2003 01:17:56]
Curvas ROC
- Si la prueba fuera intil: ambas fdps coinciden y la sensibilidad (verdaderos positivos) es

igual a la proporcin de falsos positivos, la curva sera la diagonal de (0,0) a (1,1).
- Las pruebas habituales tienen curvas intermedias.
Un parmetro para evaluar la bondad de la prueba es el rea bajo la curva que tomar valores
entre 1 (prueba perfecta) y 0,5 (prueba intil). Puede demostrarse, (Hanley y McNeil) que este
rea puede interpretarse como la probabilidad de que ante un par de individuos, uno enfermo y
el otro sano, la prueba los clasifique correctamente.
En consecuencia, las curvas ROC son tiles para:
Conocer el rendimiento global de una prueba. Area bajo la curva.
Comparar dos pruebas o dos puntos de corte. Comparacin de dos curvas o de dos puntos
sobre una curva.
Elegir el punto de corte apropiado para un determinado paciente.
Limitaciones de su uso: slo contemplan dos estados clnicos posibles (sano, enfermo) y no
sirven para situaciones en que se trata de discernir entre ms de dos enfermedades.
Ejemplo: Evaluacin del volmen corpuscular medio (VCM) en el diagnstico de anemia
ferropnica. Se usa como "patrn de oro" la existencia de depsitos de hierro en la mdula
sea
Tabla de datos (hipottica):
VCM
Sin Fe (n=34): 52, 58, 62, 65, 67, 68, 69, 71, 72, 72, 73, 73, 74, 75, 76, 77, 77, 78, 79, 80, 80,
81, 81, 81, 82, 83, 84, 85, 85, 86, 88, 88, 90, 92
Con Fe (n=66): 60, 66, 68, 69, 71, 71, 73, 74, 74, 74, 76, 77, 77, 77, 77, 78, 78, 79, 79, 80, 80,
81, 81, 81, 82, 82, 83, 83, 83, 83, 83, 83, 83, 84, 84, 84, 84, 85, 85, 86, 86, 86, 87, 88, 88, 88,
89, 89, 89, 90, 90, 91, 91, 92, 93, 93, 93, 94, 94, 94, 94, 96, 97, 98, 100, 103
Curvas ROC
Donde se observa solapamiento. Para diversos puntos de corte (es decir, decidiendo que hay
anemia cuando el VCM es menor que el punto de corte) las sensibilidad y proporciones de
falsos positivos figuran en la siguiente tabla:
Punto Corte
Sensibilidad
1-Especificidad
65
3/34=0,088
1/66=0,015
70
7/34=0,206
4/66=0,061
75
13/34=0,382
10/66=0,152
80
19/34=0,559
19/66=0,288
85
27/34=0,794
37/66=0,561
90
32/34=0,941
49/66=0,742
92
33/34=0,971
53/66=0,803
que producen la siguiente curva ROC
Curvas ROC
cuya rea es 0,717 con un EE de 0,05, es decir no es una prueba demasiado buena. Si se
quisiera comparar esta prueba con otra, p.e. niveles sricos de ferritina, se contruira para ella
otra curva y se calculara su rea. Supongamos A=0,868 y EE(A)=0,04. El estadstico para
compararlas es (si ambas curvas han sido estimadas independientemente, es decir con
distintos sujetos, en caso contrario, vase Hanley J.A., McNeil B.J. (1983)):
que en este ejemplo vale 2,34 que como es mayor que 1,96 ambas pruebas tienen un
rendimiento significativamente distinto.
Referencias
Hanley J.A., McNeil B.J. (1982) The meaning and use of the area under a receiver operating
characteristic (ROC) curve. Radiology. 143: 29-36
Hanley J.A., McNeil B.J. (1983) A method of comparing the areas under receiver operating
characteristic curves derived from the same cases. Radiology. 148: 839-43
Eleccin del punto de corte ptimo

Esta eleccin se basa en la importancia relativa que para el paciente tenga hacer un diagnstico falso positivo o
falso negativo. El diagrama de la decisin es
Representamos por U la utilidad y es un valor normalizado (ver ejemplo) que depender de las consecuencias de
la decisin y de las preferencias del paciente. La utilidad esperada de la prueba es el promedio ponderado, por las
respectivas probabilidades, de las diferentes utilidades es decir
que se puede escribir como
La curva ROC describe la relacin entre:

y
. Se trata de elegir un punto de esa curva que
maximize la funcin de utilidad. Para ello hay que resolver la ecuacin que resulta de igualar a 0 la derivada de la
utilidad respecto a
. El resultado es
El primer miembro de la igualdad es la pendiente de la curva ROC. La ecuacin nos da un criterio para elegir el
punto de corte: de tal modo que la pendiente en l sea la de la expresin. UVN-UFP es la diferencia en beneficio
entre no tratar a VN y tratar FP. Habitualmente se denomina coste neto (C) de tratar pacientes no enfermos. UVPUFN es la diferencia en beneficio entre tratar a VP y no tratar FN. Habitualmente se denomina beneficio neto (B)
de tratar sujetos enfermos. Con estas consideraciones la frmula anterior se puede escribir como
La pendiente de la curva en cada punto se puede

estimar o ajustando los puntos a una curva y calculando
la pendiente (mxima verosimilitud) o, cuando se
analizan polgonos en lugar de curvas ROC (lo ms
frecuente), del siguiente modo: la pendiente del primer
tramo (marcado en verde en la grfica: recurdese que
la pendiente es la tangente del ngulo, es decir el
cateto opuesto (Sen) dividido por el contiguo (1-Esp))
es el CP del primer punto de corte, para los dems
tramos (marcado en rojo el segundo) el cociente entre
el cambio de la sensibilidad y el cambio de la
especificidad y finalmente a cada punto se le asigna
como pendiente el promedio de los tramos respectivos.
Ejemplo: calcular las pendientes del polgono ROC del ejemplo del VCM.
La pendiente en el primer tramo es 0,088/0,015=5,87; en el segundo tramo (0,206-0,088)/(0,061-0,015)=2,57; por
tanto la pendiente para el primer punto es (5,87+2,57)/2=4,22. Repitiendo el mismo clculo para todos los puntos
resulta:
Punto Corte
Pendiente
65
4,22
70
2,25
75
1,62
80
1,08
85
0,84
90
0,65
92
0,32
Ejemplo: Usando la tabla anterior, decidir el punto de corte ptimo para un paciente con probabilidad preprueba de
0,3 y otro de 0,6.
Hay que establecer tambin las utilidades:
UVP: El paciente tiene la enfermedad y la prueba lo detecta. Asumiendo que la anemia ferropnica tenga un
tratamiento eficaz y seguro le ponemos 1 (el mximo, si no hubiera tratamiento le pondramos 0, incluso negativo
si al paciente le causara angustia un diagnstico fatal).
UFN: El paciente tiene la enfermedad y la prueba no lo detecta. Las consecuencias seran otras pruebas, que
implican gasto y retraso en el verdadero diagnstico (asumo que pasado un tiempo de no mejora se replanteara
el problema) UFN=-0,3.
Es decir el beneficio neto B=1-(-0,3)=1,3
UVN: El paciente no tiene la enfermedad y la prueba no la detecta. Asumiendo que la anemia no ferropnica
tenga tratamiento menos eficaz y menos seguro le ponemos 0,7.
UFP: El paciente no tiene la enfermedad pero la prueba la detecta. Las consecuencias seran tratamiento
inadecuado (anemia ferropnica) pero sin efectos adversos, que implica gasto y retraso en el verdadero
diagnstico (asumo que pasado un tiempo de no mejora se replanteara el problema) UFN=-0,5. Si el tratamiento
tuviera efectos adversos podra ser -0,8 o menos.
El coste neto C=0,7-(-0,5)=1,2

para ppre=0,3 la pendiente ptima sera
pend = (1,2/1,3) x (0,7/0,3) = 2,15 que segn la tabla anterior correspondera a un punto de corte un poco por
encima de 70.
para ppre=0,6 la pendiente ptima sera
pend = (1,2/1,3) x (0,4/0,6) = 0,62 que segn la tabla anterior correspondera a un punto de corte un poco por
encima de 90.
Ejemplo: El estudio PIOPED (Prospective Investigation Of Pulmonar Embolism Diagnosis), evalu la gammagrafa
V/Q para el diagnstico del EP usando la arteriografa como "gold standar". Los resultados para distintos puntos de
corte fueron:
Arterio
gam.
Sen
1-Esp
Pendiente
alta
102
14
0,41
0,03
7,29
inter
207
231
0,82
0,48
0,65
baja
246
430
0,98
0,90
0,38
norm
251
480
con un rea bajo la curva de 0,76 y un EE de 0,019.

Con estos datos los puntos de corte para distintas situaciones clnicas son:
P(E)
1/odds
C/B
Pendiente
Nivel
0,34
1,92
0,5
0,96
inter
0,34
1,92
3,84
0,15
5,67
0,5
2,84
0,15
5,67
11,34
>alta
* niveles intermedios entre alta e intermedia que habra que investigar.

Referencias
Metz C.E. (1978) Basic principles of ROC analysis. Semin Nucl Med. 8: 283-298.
The PIOPED Investigators (1990) Value of the ventilation/perfusion scan in acute pulmonary embolism. Results of
the prospective investigation of pulmonary embolism diagnosis (PIOPED). JAMA. 263: 2753-2759.
Sesgos en la evaluacin de pruebas diagnsticas
Sesgos en la evaluacin de pruebas diagnsticas

Los ms frecuentes en este tipo de estudio son:
Sesgo de confirmacin diagnstica al limitar el estudio a los pacientes a quienes se les hizo
en su da el "gold standard" que suelen ser los que ms probablemente tengan la enfermedad,
por tanto las pruebas positivas estn sobre-representadas (sobreestimacin de la sensibilidad)
y las negativas infra-representadas (infraestimacin de la especificidad). Frecuentemente es
imposible evitarlo por razones ticas. Hay tcnicas matemticas complejas para controlarlo.
Sesgo de interpretacin de las pruebas si no se hacen independientemente.
Sesgo debido a resultados no interpretables de la prueba problema si dicho problema no
tiene la misma frecuencia en ambos grupos.
Ausencia de gold standard definitivo.
Condiciones de generalizacin
Espectro de la enfermedad ("Case mix") Una prueba puede tener distintos grados de
exactitud para diferentes grados de severidad de la enfermedad. Deben siempre comunicarse
las caractersticas clnicas de los pacientes incluidos en el estudio.
Variabilidad interobservador: Todas las pruebas (unas ms que otras) requieren cierto
grado de pericia en su realizacin e interpretacin. Dos observadores pueden ser igualmente
exactos pero ser uno ms sensible o especfico que otro, en otras palabras operar con la
misma curva ROC pero en puntos distintos o pueden tener distinta exactitud (operar en la
misma prueba con distinta curva ROC).
http://www.hrc.es/bioest/roc_3.html [02/01/2003 01:19:27]
Modelos de regresin logstica
MODELOS DE REGRESION LOGISTICA

V. Abraira
Bibliografa:
V. Abraira, A.Prez de Vargas
L.C. Silva Ayaguer
Excursin a la regresin logstica en Ciencias de la Salud
Daz de Santos. 1995
D.W. Hosmer, S. Lemeshow
Applied Logistic Regression.
John Wiley & Sons. 1989.
Asociacin entre variables binomiales
Se dice que un proceso es binomial cuando slo tiene dos posibles resultados:
"xito" y "fracaso", siendo la probabilidad de cada uno de ellos constante en una
serie de repeticiones. A la variable nmero de xitos en n repeticiones se le
denomina variable binomial. A la variable resultado de un slo ensayo y, por
tanto, con slo dos valores: 0 para fracaso y 1 para xito, se le denomina
binomial puntual.
Un proceso binomial est caracterizado por la probabilidad de xito,
representada por p (es el nico parmetro de su funcin de probabilidad), la
probabilidad de fracaso se representa por q y, evidentemente, ambas
probabilidades estn relacionadas por p+q=1. En ocasiones, se usa el cociente
p/q, denominado "odds", y que indica cunto ms probable es el xito que el
fracaso, como parmetro caracterstico de la distribucin binomial aunque,
evidentemente, ambas representaciones son totalmente equivalentes.
Los modelos de regresin logstica son modelos de regresin que permiten
estudiar si una variable binomial depende, o no, de otra u otras variables (no
necesariamente binomiales): Si una variable binomial de parmetro p es
independiente de otra variable X, se cumple p=p|X, por consiguiente, un modelo
de regresin es una funcin de p en X que a travs del coeficiente de X permite
investigar la relacin anterior.
Ejemplo 1: Se quiere comparar la eficacia de dos tratamientos alternativos para
una misma enfermedad. Asumiendo que el proceso "curar" slo tiene dos
resultados: s o no y que la probabilidad de curacin es la misma para todos los
enfermos, se trata de un proceso binomial. Se trata de ver si este proceso est
asociado, o no, con el tratamiento, es decir, si la probabilidad de curacin dado
http://www.hrc.es/bioest/Reglog_1.html (1 of 4) [02/01/2003 01:25:57]
el tratamiento A es igual, o distinta, a la probabilidad de curacin dado el

tratamiento B. Supngase que sobre una muestra aleatoria de 40 enfermos,
dividida aleatoriamente en dos grupos de 20, a cada uno de los cuales se le
suministra un tratamiento, se obtienen los siguientes resultados:
tratamiento. A
(X=1)
tratamiento. B
(X=0)
curacin
18
13
no
Total
20
20
Si se define la variable tratamiento como X=1 para el tratamiento A y X=0 para

el B, a partir de la tabla podemos estimar la probabilidad de curacin para el
tratamiento B: p|(X=0)=13/20 y para el tratamiento A: p|(X=1)=18/20 Como
ambas probabilidades son distintas, "parece" que la probabilidad de curacin
depende del tratamiento. Las preguntas son: esta dependencia es
generalizable ("estadsticamente significativa")? cunto depende ("clnicamente
relevante")?
La primera pregunta la podemos resolver mediante la prueba 2, la segunda
mediante las denominadas "medidas de asociacin", o "de fuerza de la
asociacin", o "de efecto": diferencia de riesgo (DR), riesgo relativo (RR) y "odds
ratio" (OR). En el ejemplo:
DR: 18/20 - 13/20 = 5/20 =0,25
RR: (18/20)/(13/20) = 18/13 = 1,38
OR: ((18/20)/(2/20))/(13/20)/(7/20) =(18x7)/(13x2) = 4,85
DR es 0 en caso de no diferencia, mientras que RR y OR son ambos 1.
Recordemos que el OR, aunque es la medida menos intuitiva1,2, es la ms
extendida por diversas razones y que es conveniente que a estas estimaciones
puntuales las acompaemos de su intervalo de confianza que nos indica la
precisin de la estimacin.
Ejemplo 2: Para refrescar los conceptos de odds ratio y riesgo relativo. Sean
dos juegos, en uno (X=0) se apuesta sobre la salida de una cierta cara en una
tirada de un dado, y en otro (X=1) sobre la salida de una cara en la tirada de una
moneda. Evidentemente, la probabilidad de ganar es para el dado p|(X=0)=1/6 y
para la moneda p|(X=1)=1/2 El riesgo relativo es:
que, como es distinto de 1, quiere decir que la probabilidad de ganar est

asociada al tipo de juego, y que es 3 veces ms probable ganar con la moneda
que con el dado. El odds ratio para este ejemplo es:
el odds para la moneda es 5 veces el odds del dado, es decir, a la larga la razn
de partidas ganadas/perdidas es 5 veces mayor para la moneda que para el
dado. Para decidir a que juego interesa jugar hay que comparar este odds ratio
con la razn de los cocientes entre lo que se puede ganar y perder en cada
jugada en ambos juegos. El OR est siempre ms alejado de 1 que el RR,
aunque cuando las probabilidades son muy pequeas la diferencia (entre el OR
y el RR) es pequea.
Se trata, ahora, de comparar el juego de la lotera nacional (X=1) en el que el
premio es para un nmero extrado de entre 100.000, con el de la lotera
primitiva (X=0) en que se premia una combinacin de 6 nmeros de entre las
que se pueden formar con 49 nmeros. Resulta p|(X=1)=1/100.000. El nmero
de combinaciones de 6 nmeros que se pueden formar con 49 es
C49;6=13.983.816 por lo tanto p|(X=0)=1/13.983.816 y:
es aproximadamente 140 veces ms probable ganar en el juego de la lotera

que en el de la lotera primitiva. El odds ratio para este ejemplo es:
que, como era de esperar, debido a los pequeos valores de p|X=1 y p|X=0 es
prcticamente igual que el riesgo relativo (recordar cuando la prevalencia es
baja, el OR estima el RR).
1 Odds ratios should be avoided when events are common. Altman DG et al.
BMJ. 317:1318. 1998
2 When can odds ratios mislead? Davies HTO et al. BMJ. 316:989-991. 1998
3 Medidas del efecto de un tratamiento (I): reduccin absoluta del riesgo,
reduccin relativa del riesgo y riesgo relativo. Abraira V. SEMERGEN 26: 535536. 2000.
4 Medidas del efecto de un tratamiento (II): odds ratio y nmero necesario para
tratar. Abraira V. SEMERGEN 27: 418-420. 2001.
Modelo de Regresin logstica simple
Modelo de regresin logstica simple

Para una nica variable independiente X, el modelo de regresin logstica toma
la forma:
o, para simplificar la notacin, simplemente:
donde ln significa logaritmo neperiano, 0 y 1 son constantes y X una variable

que puede ser aleatoria o no, continua o discreta. Este modelo se puede
fcilmente generalizar para k variables independientes:
Por simplicidad, vamos a empezar por el modelo simple, extendindonos

despus al modelo mltiple.
Hay varias razones para plantear el modelo con el logaritmo del odds, en lugar
de plantearlo simplemente con la probabilidad de xito o con el odds. En primer
lugar, el campo de variacin de ln(p/q) es todo el campo real (de - a ),
mientras que, para p el campo es slo de 0 a 1 y para p/q de 0 a . Por lo tanto,
con el modelo logstico no hay que poner restricciones a los coeficientes que
complicaran su estimacin. Por otro lado, y ms importante, en el modelo
logstico los coeficientes son, como veremos enseguida, fcilmente
interpretables en trminos de independencia o asociacin entre las variables.
Hay otras formas equivalentes de poner el modelo, de modo que en diferentes
textos se puede ver de otra forma, que para ciertas aplicaciones son ms
cmodas de usar:
Estas dos ltimas expresiones, si son conocidos los coeficientes, permiten

calcular directamente la probabilidad del proceso binomial para los distintos
valores de la variable X.
A la funcin:
que aparece en otros muchos campos de la matemtica aplicada, y cuya grfica

se muestra en la figura, se le denomina funcin logstica. El modelo de regresin
logstica, por tanto, modeliza la probabilidad de un proceso binomial como la
funcin logstica de una combinacin lineal de la(s) variable(s) dependiente(s).
Veamos, ahora, qu significan los coeficientes en el modelo. Supngase por el

momento que la variable X slo puede tomar los valores 0 y 1. Para el valor X=0
el modelo queda:
por tanto 0 es el logaritmo del odds cuando la variable independiente es cero.

Para el valor X=1:
por lo tanto:
es decir 1 es el logaritmo del cociente de los odds para los dos valores de la
variable X, u "odds ratio" (OR), Si la variable binomial es independiente de la
variable X, ambos odds son iguales, por lo tanto el odds ratio es 1 y su logaritmo
ser cero. Por lo tanto, para estudiar con un modelo logstico la independencia
de las variables, basta con estudiar si el coeficiente 1 es cero.
En el caso que se est considerando de una variable independiente con slo
dos valores, el riesgo relativo se puede poner, usando las otras formas del
modelo:
Otro modo de expresar estos resultados es decir que

y
es el odds cuando X=0
el odds ratio entre X=1 y X=0. Si la variable X puede tomar ms valores,
sigue siendo el odds cuando X=0 y

el odds ratio para el
evidentemente
aumento de una unidad en la variable X. Ntese que, por lo tanto, el modelo
implica que este odds ratio es constante. Del mismo modo que en regresin
lineal, cuando no tiene sentido fsico X=0 (por ejemplo edad, presin arterial),
se interpreta como el odds basal, es decir, el odds que no depende de la
variable independiente.
Ejemplo 3: Se trata de estudiar el efecto dosis-respuesta para un tratamiento. A
una muestra aleatoria de enfermos se la divide tambin aleatoriamente en 4
grupos, al primero no se le administra tratamiento, al segundo se le administra
una cierta dosis, digamos 50 mg, al tercero 100 mg y al cuarto 150 mg y, como
en el ejemplo anterior, se mide la respuesta como curacin o no curacin. Ahora
la variable X tiene 4 valores que pueden ser, bien los mg de cada dosis (0, 50,
100, 150) o bien un cdigo arbitrario para cada dosis (p.e. 0, 1, 2, 3). Si se
plantea un modelo logstico, 0 ser el logaritmo del odds de la dosis 0 (el
logaritmo del odds de la curacin para los enfermos no tratados) y 1 el
logaritmo del odds ratio por aumento de unidad de dosis. Conviene tener
presente dos aspectos: 1 la dependencia de 1 de la codificacin de la variable
X, si se usan los mg la unidad es 1 mg y si se usan los cdigos, la unidad es el
cambio de dosis y 2 el modelo asume que el cambio en el logaritmo del odds es
constante, es decir el logaritmo del odds cambia 1 por pasar de la dosis 0 a la
1, o por pasar de la dosis 2 a la 3. Cunto cambia por pasar de la dosis 0 a la
2?. Segn el modelo:
es decir, el cambio en el logaritmo del odds o, lo que es lo mismo, el logaritmo

del odds ratio de la dosis 2 con respecto al no tratamiento es 2 veces el
logaritmo del odds ratio de la dosis 1, por consiguiente el odds ratio de la dosis 2
es el cuadrado del odds ratio de la dosis 1, o dicho de otro modo, el modelo
asume efectos multiplicativos. (sta es la nica asuncin del modelo). En
general, para un aumento de la variable X desde x0 a x1, siendo = x0 - x1
Ejemplo 4: Para estudiar la posible asociacin entre la tuberculosis pulmonar y

el contacto con el ganado vacuno se eligen aleatoriamente 100 enfermos y,
tambin aleatoriamente, 100 personas no enfermas y se investiga en ambos
grupos dicho contacto. Obsrvese que el diseo del estudio es diferente al de
los ejemplos anteriores (ahora es un estudio caso-control), ahora se extraen dos
muestras de dos poblaciones diferentes (enfermos y no enfermos). El resultado
del estudio puede presentarse tambin en forma de tabla de doble entrada
similar a la del ejemplo 1:
sin contacto
(X=0)
con contacto
(X=1)
enfermos
no enfermos
A partir de esta tabla no se pueden estimar p|X=0 ni p|X=1 ya que los datos para
X=0 y X=1 no provienen de una nica muestra. Dado que se ha muestreado
independientemente en enfermos y no enfermos, las probabilidades que s se
pueden estimar a partir de la tabla son p(X=0|E), p(X=0|nE), p(X=1|E) y
p(X=1|nE) cuyos estimadores son respectivamente A/(A+B), C/(C+D), B/(A+B) y
D/(C+D).
Para calcular a partir de ellos p(E|X=0), p(nE|X=0), p(E|X=1) y p(nE|X=1),
aplicando el teorema de Bayes, sera necesario conocer p(E) y p(nE), para las
que la tabla no ofrece ningn estimador, por consiguiente no se puede estimar el
odds para X=0 ni para X=1. S se puede, sin embargo, (aplicando el teorema de
Bayes) estimar el odds ratio y se obtiene:
Obsrvese que, como en el ejemplo anterior, es tambin el cociente de los

productos cruzados de los elementos de la tabla.
Es decir, con el esquema de muestreo de este ejemplo se puede estimar el odds
ratio, pero no el odds para X=0, o dicho en trminos del modelo logstico, se
puede estimar 1, pero no 0. Sin embargo, el estimador de 1 es el mismo que
en los ejemplos anteriores que corresponden a un nico proceso de muestreo o
al muestreo de los estudios de cohorte. Dicho de otro modo, cuando se aplica el
modelo logstico a estudios caso-control, el coeficiente 0 no tiene ningn
significado, sin embargo el coeficiente 1 significa lo mismo (y se estima del
mismo modo) que en estudios de cohortes.
Estimacin de los coeficientes

Aunque existen otros mtodos, el ms extendido es el de mxima verosimilitud,
que consiste en maximizar la funcin de verosimilitud de la muestra. Este
procedimiento es matemticamente complejo, pero lo que importa para el
usuario es:
1 El proceso es iterativo, es decir se dan a los coeficientes unos valores
arbitrarios (habitualmente, aunque no necesariamente, el valor 0). Algunos
paquetes estadsticos (p.e. el PRESTA) preguntan por estos valores, otros (p.e.
el SPSS o el SAS) no y asumen 0. La solucin final no depende de estos
valores pero s el tiempo de clculo y a veces puede ser necesario "jugar" con
ellos (lo veremos ms adelante).
2 A partir de estos valores iniciales se construye una matriz con los valores
previstos por el modelo para las observaciones de la variable dependiente.
3 A partir de esta matriz y de la matriz X de diseo (construida igual que en
regresin lineal), se calculan los nuevos estimadores, que se comprueba si son
ya la solucin, en cuyo caso se para el proceso y en caso contrario se repite el
proceso. En la prctica, y para evitar convergencias asintticas, tambin se para
el proceso si los nuevos estimadores difieren de los anteriores en menos de una
cierta cantidad, llamada lmite de convergencia.
En este ltimo paso hay que invertir una matriz y eso puede dar problemas
(colinealidad) que veremos ms adelante.
Distribucin muestral de los estimadores
Hay un teorema (teorema del lmite central en la estimacin por mxima
verosimilitud) que dice estos estimadores son asintticamente normales y su
matriz de varianzas-covarianzas es
= -J -1 = -(X'X) -1
y su estimacin se calcula, particularizando para los coeficientes estimados.
Recordar que las varianzas de los coeficientes estn en la diagonal principal de
esta matriz.
http://www.hrc.es/bioest/Reglog_3.html [02/01/2003 01:27:17]
Intervalos y contrastes
Estimacin por intervalos y contrastes de hiptesis sobre los coeficientes

Teniendo en cuenta lo anterior , un intervalo de confianza al (1- )% para el
coeficiente i es:
Hay que tener en cuenta que los estimadores habituales de la asociacin no son
los coeficientes i sino los odds ratio, por lo tanto los intervalos de confianza que
interesan calcular son los de los odds ratio. Evidentemente dichos intervalos
estn dados por:
El estadstico para el contraste:

H0: i = a
H1: i a siendo a una constante, es:
y la regin crtica: |z| > z/2

o equivalentemente:
que se distribuye como una ji-cuadrado con 1 grado de libertad y, por tanto, la
regin crtica para el contraste es
contrastes de Wald.
. A estos contrastes se les denominan
Un contraste que interesa realizar es 1=0; si no se puede rechazar esta

hiptesis indica, salvo problemas de potencia del contraste, que la variable Y no
depende de X.
Ejemplo 5: Estimar por mxima verosimilitud los parmetros del modelo
logstico para los datos del ejemplo 1.
Para realizarlo con un paquete estadstico hay que partir de un archivo en que
los datos estn individualizados, es decir un archivo con 40 casos (los enfermos)
con dos variables una para el tratamiento con los valores 0 y 1 y otra para el
resultado, tambin con dos valores 0: no curacin y 1: curacin. Sera, por tanto:
Curacin
Tratamiento
13 casos
7 casos
18 casos
2 casos
y el resultado del procesamiento:
Ntese que la estimacin del OR coincide con las obtenidas en el ejemplo 1. El

programa ofrece adems de las estimaciones de los coeficientes, sus
exponenciales, es decir, el odds para X=0 (1,857) y el odds ratio (4,846), as
como la ji-cuadrado (prueba de Wald) y su valor p asociado para los contrastes
H0: i=0. Calcula tambin el intervalo de confianza con un nivel de confianza del
95% para el odds ratio; el hecho de que el intervalo de confianza incluya el 1 es
un modo de ver que, con ese nivel de confianza, no hay diferencia significativa
entre ambos tratamientos, totalmente equivalente al contraste sobre 1
(p=0,073).
Ejemplo 6: En un estudio para ver la dependencia de la dosis en el efecto de un
veneno, se seleccionan aleatoriamente 4 grupos de 4 animales cada uno a los

que se suministran distintas dosis (0, 1, 2, 3) del mismo y se observan las
muertes provocadas. Los resultados se muestran en la siguiente tabla:
Dosis
Muertes
El resultado de la estimacin para la regresin logstica es:
El estimador del odds para la dosis 0 (es decir del cociente de la probabilidad de
que un animal muera y la probabilidad de que no muera, en el tiempo del
experimento, si no se le suministra veneno) es 0,068 (es ms probable que
sobreviva) aunque no es significativamente distinto de 1 (p=0,052). El estimador
del odds ratio para el aumento de una dosis es 4,539 (es decir el odds se
multiplica por esa cantidad por cada aumento de dosis) y es significativamente
distinto de 1 (p=0,036).
Cul sera el odds para la dosis 2? Se calcula:
tambin, evidentemente, se puede calcular como:
(la diferencia en la tercera cifra decimal es debida a problemas de precisin)

Para realizar el contraste de si es significativamente distinto de 1 hay que
estimar su varianza:
y, por tanto el estadstico para el contraste:
Modelo mltiple
Modelo mltiple
Es una generalizacin del modelo simple:
y la interpretacin de los coeficientes es tambin una generalizacin, es decir,

es el odds cuando todas las Xi=0 y
es el odds ratio por el aumento de una
unidad en la variable Xi manteniendo constantes las otras (controlando por
ellas). Ntese que ahora la asuncin de "multiplicatividad" del modelo se refiere
tanto al aumento dentro de cada variable, como a las distintas variables y como
antes, cuando no tiene sentido fsico Xi=0,
se interpreta como el odds basal,
es decir, el odds que no depende de las variables independientes.
Los coeficientes se estiman y los contrastes de hiptesis se realizan del mismo
modo que en el modelo simple, aunque con el modelo mltiple (igual que en
regresin lineal) se pueden hacer contrastes no slo sobre cada coeficiente,
sino tambin sobre el modelo completo o para comparar modelos (equivalentes
a los que en regresin lineal se hacen con la F y la Fpar), que en regresin
logstica se hacen con el llamado logaritmo del cociente de verosimilitudes (log.
likelihood ratio)
Ejemplo 7: Estudiar, mediante un modelo de regresin logstica, la posible
asociacin entre el cncer de vejiga, el consumo de caf y el ambiente de
residencia. Se eligen 50 pacientes con cncer y 50 individuos sin la enfermedad
y se definen tres variables: CANCER con los valores 0 (no cncer) y 1 (cncer),
CAFE con los valores 0 (sin consumo de caf) y 1 (consumo de caf) y MEDIO
con los valores 0 (medio rural) y 1 (medio urbano).
Los resultados se resumen en la tabla siguiente:
caf
no caf
urbano
rural
urbano
rural
Cncer
32
15
no cncer
15
10
15
10
La salida del programa de ordenador (SPSS) (cmo sera el archivo?):
Modelo mltiple
La "Ji-cuadrado del modelo" (19,504 p=0,000) corresponde al contraste para

el modelo completo. Aunque tambin se puede hacer la prueba para comparar
un modelo con Caf y Medio con otro que slo contenga Caf:
En este caso de un bloque con una sola variable, la prueba sera equivalente a
la de Wald para Medio. El que no coincidan exactamente (12,040 la de Wald y
16,864 la del logaritmo del cociente de verosimilitudes) es debido a que ambas
son aproximadas. Si la discrepancia fuera muy grande indicara que el tamao
muestral es pequeo para aplicar estas pruebas.
Prueba de Hosmer-Lemeshow
Es otra prueba para evaluar la bondad del ajuste de un modelo de regresin
logstica, aunque su uso est ms discutido que la anterior. La idea es si el
ajuste es bueno, un valor alto de la p predicha se asociar (con un frecuencia
parecida a la p) con el resultado 1 de la variable binomial. Se trata de calcular
para cada observacin del conjunto de datos las probabilidades de la variable
dependiente que predice el modelo, agruparlas y calcular, a partir de ellas, las
frecuencias esperadas y compararlas con las observadas mediante la prueba
2.
Ejemplo 8: La prueba de Hosmer-Lemeshow para el modelo del ejemplo

Modelo mltiple
anterior da como resultado:
rea bajo la curva ROC

La prueba de Hosmer-Lemeshow evala un aspecto de la validez del modelo: la
calibracin (grado en que la probabilidad predicha coincide con la observada).
El otro aspecto es la discriminacin (grado en que el modelo distingue entre
individuos en los que ocurre el evento y los que no).
Como medida de la discriminacin se usa el rea bajo la curva ROC construida
para la probabilidad predicha por el modelo, que representa, para todos los
pares posibles de individuos formados por un individuo en el que ocurri el
evento y otro en el que no, la proporcin de los que el modelo predice una
mayor probabilidad para el que tuvo el evento.
Para el modelo del ejemplo anterior
Modelo mltiple
Variables "dummy"
Variables indicadoras ("dummy")

En los modelos de regresin logstica la "multiplicatividad" se asume. Esto, p.e.
para la variable DOSIS del ejemplo 6, quiere decir que el OR para la muerte
(variable dependiente) de la DOSIS 2 con respecto a la DOSIS 0 es el cuadrado
del OR de la DOSIS 1. Es razonable esta asuncin?
La solucin es la misma que en regresin lineal; crear tantas variables como
categoras menos 1 denominadas variables indicadoras con el siguiente
esquema
X1
X2
X3
Dosis 0
Dosis 1
Dosis 2
Dosis 3
El modelo quedara
Por lo tanto, para la dosis 0, como las tres variables son 0
es decir
es el odds para la dosis 0
Para la dosis 1 el modelo queda
restando ambas expresiones
por lo tanto
es el OR de la dosis 1 con respecto a la dosis 0, del mismo modo
es el OR de la dosis 2 con respecto a la dosis 0, etc. El segundo esquema de

codificacin visto en regresin lineal no tienen una clara interpretacin en
regresin logstica, mientras que el tercero tiene una interpretacin similar a la
Variables "dummy"
que tena all.

Conviene destacar que estas variables indicadoras no tienen ningn sentido por
s solas y por, lo tanto, deben figurar en los modelos y se debe contrastar su
inclusin siempre en bloque.
Ejercicio propuesto: Para los datos del Ejemplo 6, crear variables "dummy"
para la dosis e interpretrar los coeficientes y comentar las diferencias.
Interaccin y confusin en regresin logstica
Interaccin y confusin en la regresin logstica

Los modelos de regresin, como en el caso lineal, pueden usarse con dos
objetivos: 1) predictivo en el que el inters del investigador es predecir lo mejor
posible la variable dependiente, usando un conjunto de variables independientes
y 2) estimativo en el que el inters se centra en estimar la relacin de una o ms
variables independientes con la variable dependiente. El segundo objetivo es el
ms frecuente en estudios etiolgicos en los que se trata de encontrar factores
determinantes de una enfermedad o un proceso.
La interaccin y la confusin son dos conceptos importantes cuando se usan los
modelos de regresin con el segundo objetivo, que tienen que ver con la
interferencia que una o varias variables pueden realizar en la asociacin entre
otras.
Existe confusin cuando la asociacin entre dos variables difiere
significativamente segn que se considere, o no, otra variable, a esta ltima
variable se le denomina variable de confusin para la asociacin. Existe
interaccin cuando la asociacin entre dos variables vara segn los diferentes
niveles de otra u otras variables.
Veamos tambin aqu estos conceptos sobre los modelos. El modelo ms
sencillo para estudiar la asociacin entre una variable binomial y otra variable X1
es
ln(p/q) = 0 + 1X1
donde 1 cuantifica la asociacin:
es el odds ratio por unidad de cambio en
X1. Se dice que X2 es una variable de confusin para esta asociacin, si el
modelo
ln(p/q) = 0 + 1X1 + 2X2
produce una estimacin para 1 diferente del modelo anterior. Evidentemente
esta definicin se puede ampliar a un conjunto de variables, se dice que las
variables X2, ..., Xk son variables de confusin si la estimacin de 1 obtenida
por el modelo
ln(p/q) = 0 + 1 X1 + 2 X2 + ... + k Xk
es diferente de la obtenida en el modelo simple. En ambos casos se dice que la
estimacin de 1 obtenida en los modelos mltiples est controlada o ajustada
por X2 o por X2 ,..., Xk
Contrastar la existencia de confusin requiere, por lo tanto, comparar los
coeficientes de regresin obtenidos en dos modelos diferentes y si hay

diferencia, existe la confusin, en cuyo caso la mejor estimacin es la ajustada.
Para dicha comparacin no se precisa realizar un contraste de hiptesis
estadstico ya que aunque la diferencia encontrada sea debida al azar,
representa una distorsin que la estimacin ajustada corrige. Ser el
investigador quin establezca el criterio para decidir cuando hay diferencia. Lo
habitual es considerar que existe confusin cuando la exponencial del
coeficiente (el OR) cambia en ms del 10%.
El modelo ms sencillo que hace explcita la interaccin entre dos variables X1 y
X2 es
ln(p/q) = 0 + 1 X1 + 2 X2 + 3 X1 X2
En este modelo, el logaritmo del odds para unos valores determinados x1, x2 de
X1, X2 es
ln(p/q) = 0 + 1 x1 + 2 x2 + 3 x1 x2
y para los valores x1 + 1 y x2
ln(p/q) = 0 + 1(x1 + 1) + 2 x2 + 3 (x1 + 1) x2 = 0 + 1 x1 + 1 + 2 x2 + 3
x1 x2 + 3 x2
restando ambas se encuentra el cambio en ln(p/q) por una unidad de cambio en
X1 manteniendo fijo X2
1 + 3 x2
o dicho de otra manera, el odds ratio por una unidad de cambio en X1
manteniendo fijo X2 es
que es diferente para cada valor x2 de X2. Del mismo modo, el cambio en ln(p/q)
por una unidad de cambio en X2 manteniendo fijo X1 es
2 + 3 x1, o en trminos del OR, el odds ratio por una unidad de cambio en X2
manteniendo fijo X1 es
Por lo tanto, contrastar la existencia de interaccin entre X1 y X2 es contrastar si

el coeficiente 3 es cero (no hay interaccin), o distinto de cero (existe

interaccin). Ntese que para poder interpretar as este contraste es necesario
que en el modelo figuren las variables X1, X2 y X1X2.
En caso de que exista interaccin los coeficientes los exponenciales de 1 y 2
por s solos no significan nada y la asociacin de las variables X1 y X2 con la
binomial estar cuantificada por las expresiones anteriores.
Es obvio que primero debe contrastarse la interaccin y despus, en caso de
que no exista, la confusin.
Ejemplo 9: Estudiar para los datos del ejemplo 7 la posible interaccin y/o
confusin.
Para estudiar interaccin hay que crear la variable producto CAFXME. El
modelo completo es:
como ya se dijo antes, para este esquema de muestreo el coeficiente 0 no

significa nada, 1 es el aumento del logaritmo del odds por consumir caf en un
ambiente rural, 2 es el aumento del logaritmo del odds por vivir en un ambiente
urbano, con respecto al rural, sin consumir caf y 3 modeliza la posible
interaccin o dicho en otros trminos el "sobreaumento" por ambas cosas
(consumir caf en un medio urbano). El primer contraste a realizar es sobre la
interaccin, es decir, H0: 3=0.
La salida del SPSS para este modelo es:
Con la prueba del logaritmo del cociente de verosimilitudes, el modelo completo

es significativo (p=0,000). Con la prueba de Wald para el trmino de interaccin,

no se puede rechazar (p=0,296) la hiptesis nula de no existencia de interaccin
y, por tanto, habra que volver a ajustar a un modelo que tuviera solamente las
variable CAFE y MEDIO (el del ejemplo 7). Sin embargo, y a efectos didcticos,
se va a estudiar el efecto de un error de tipo II en dicho contraste. Supngase,
por lo tanto, que el coeficiente 3 es realmente distinto de 0. En este caso no
puede hablarse de un odds ratio para el caf, sino que habra un odds ratio para
el caf en el medio rural y otro distinto en el medio urbano. Segn el modelo, el
odds ratio estimado para el caf en el medio rural es:
y su intervalo de confianza al 95%:
Ntese que ste es el intervalo de confianza que presenta el programa cuya

salida se est analizando. No presenta, sin embargo, el que se va a calcular
ahora. En general, los paquetes estadsticos calculan los intervalos de confianza
asumiendo que no hay trminos de interaccin y, por tanto, son slo
parcialmente vlidos cuando existe interaccin.
Ahora, el odds ratio estimado para el caf en el medio urbano es:
para calcular su intervalo de confianza se necesita estimar la varianza de
y, por tanto, su intervalo de confianza al 95%:
Obsrvese que en el caso de que exista interaccin, los resultados son

radicalmente distintos para el medio urbano (el odds ratio para el caf es 2,134)
que para el medio rural (el odds ratio para el caf es 0,5). Si se comparan estos
resultados con los del modelo sin el trmino de interaccin:
se observa, como era de esperar, un estimador para el odds ratio del caf,
intermedio entre los calculados en el supuesto anterior. Conviene, por
consiguiente, calcular la potencia del contraste con el que se rechaz la
existencia de interaccin. El contraste fue:
H0: 3 = 0
H1: 3 0
y la potencia es: 1 = Prob(rechazar H0|H1 verdadera). Con el nivel de
significacin =0,05, se rechaza H0 si
es decir si
Concretando H1, por ejemplo 3=1, se trata de calcular la probabilidad de

encontrar
si 3 fuera 1. Teniendo en cuenta la normalidad de
es decir, la potencia del contraste es efectivamente muy baja y habra que ser
muy prudente a la hora de comunicar los resultados de este estudio.
Debido a los dos objetivos distintos que un anlisis de regresin puede tener es
difcil establecer una estrategia general para encontrar el mejor modelo de
regresin, es ms, el mejor modelo significa cosas distintas con cada objetivo.
En un anlisis predictivo el mejor modelo es el que produce predicciones ms
fiables para una nueva observacin, mientras que en un anlisis estimativo el
mejor modelo es el que produce estimaciones ms precisas para el coeficiente
de la variable de inters.
En ambos casos se prefiere el modelo ms sencillo posible (a este modo de
seleccionar modelos se le denomina parsimonia), de modo que en un anlisis
estimativo, se puede excluir del modelo una variable que tenga un coeficiente
significativamente distinto de cero y que su contribucin a la prediccin de la
variable dependiente sea importante, porque no sea variable de confusin para
la variable de inters (el coeficiente de dicha variable no cambia), en un anlisis
predictivo esa variable no se excluira.
Sin embargo, hay una serie de pasos que deben realizarse siempre:
i) Especificacin del modelo mximo.
ii) Especificacin de un criterio de comparacin de modelos y definicin de una
estrategia para realizarla.
iii) Evaluacin de la fiabilidad del modelo.
i) Especificacin del modelo mximo
Se trata de establecer todas las variables que van a ser consideradas.
Recurdese que el modelo saturado (el mximo que se puede considerar) tiene
n - 1 variables pero que, en general, el modelo saturado no tiene inters y el
modelo mximo deber tener menos variables independientes que el modelo
saturado (un criterio habitual es incluir como mximo una variable cada 10
eventos).
El criterio para decidir qu variables forman el modelo mximo lo establece el
investigador en funcin de sus objetivos y del conocimiento terico que tenga
sobre el problema, evidentemente cuanto menor sea el conocimiento previo
mayor tender a ser el modelo mximo.
Un modelo mximo grande minimiza la probabilidad de error tipo II o infraajuste,
que en un anlisis de regresin consiste en no considerar una variable que
realmente tiene un coeficiente de regresin distinto de cero.
Un modelo mximo pequeo minimiza la probabilidad de error tipo I o
sobreajuste (incluir en el modelo una variable independiente cuyo coeficiente de
regresin realmente sea cero).
Debe tenerse en cuenta tambin que un sobreajuste, en general, no introduce
sesgos en la estimacin de los coeficientes (los coeficientes de las otras

variables no cambian), mientras que un infraajuste puede producirlos, pero que
un modelo mximo grande aumenta la probabilidad de problemas de
colinealidad.
En el modelo mximo deben considerarse tambin los trminos de interaccin
que se van a introducir (en un modelo estimativo slo interesan interacciones
entre la variable de inters y las otras)
ii) Comparacin de modelos
Debe establecerse cmo y con qu se comparan los modelos. Si bien hay varios
estadsticos sugeridos para comparar modelos, el ms frecuentemente usado es
el logaritmo del cociente de verosimilitudes, recordando que cuando los dos
modelos slo difieren en una variable, el contraste con el logaritmo del cociente
de verosimilitudes es equivalente al contraste de Wald, pero a veces interesa
contrastar varias variables conjuntamente mejor que una a una (por ejemplo
todos los trminos no lineales) o, incluso, es necesario hacerlo (por ejemplo
para variables indicadoras).
Hay que hacer notar que en un anlisis estimativo el criterio para incluir o excluir
variables distintas a las de inters, es sobre todo los cambios en los coeficientes
y no los cambios en la significacin del modelo.
Los distintos modelos a comparar se pueden construir de dos formas: por
eliminacin o hacia atrs ("backward") y por inclusin o hacia adelante
("forward").
Con la primera estrategia, se ajusta el modelo mximo y se calcula el logaritmo
del cociente de verosimilitudes para cada variable como si fuera la ltima
introducida (que es equivalente al contraste de Wald para esa variable), se elige
el menor de ellos y se contrasta con el nivel de significacin elegido. Si es mayor
o igual que el valor crtico se adopta este modelo como resultado del anlisis y si
es menor se elimina esa variable y se vuelve a repetir todo el proceso hasta que
no se pueda eliminar ninguna variable.
Con la estrategia hacia adelante, se empieza con un modelo de una variable,
aquella que presente el mejor logaritmo del cociente de verosimilitudes. Se
calcula el logaritmo del cociente de verosimilitudes para la inclusin de todas las
dems, se elige el menor de ellos y se contrasta con el nivel de significacin
elegido. Si es menor que el valor crtico, se para el proceso y se elige el modelo
simple como mejor modelo, y si es mayor o igual que dicho valor crtico, esa
variable se incluye en el modelo y se vuelve a calcular el logaritmo del cociente
de verosimilitudes para la inclusin de cada una de todas las restantes, y as
sucesivamente hasta que no se pueda incluir ninguna ms.
Una modificacin de esta ltima estrategia es la denominada "stepwise" que
consiste en que, cada vez que con el criterio anterior se incluye una variable, se
calculan los logaritmos del cociente de verosimilitudes de todas las incluidas
hasta ese momento como si fueran las ltimas y la variable con menor logaritmo
del cociente de verosimilitudes no significativo, si la hubiera, se elimina. Se
vuelven a calcular los logaritmos del cociente de verosimilitudes y se continua
aadiendo y eliminando variables hasta que el modelo sea estable.
Las variaciones a estas estrategias consisten en que, con cualquiera de ellas, se
puede contrastar varias variables en lugar de una sola y que, en aplicacin del
principio jerrquico, cuando se contrasta un trmino de interaccin, el modelo
debe incluir todos los trminos de orden inferior y, si como resultado del
contraste, dicho trmino permanece en el modelo, tambin ellos deben
permanecer en el mismo, aunque no se pueda rechazar que los coeficientes
correspondientes no son distintos de cero.
En cualquier caso, puede ser peligroso aplicar cualquiera de estas estrategias
automticamente (con un paquete estadstico, por ejemplo) por lo que se ha
comentado ms arriba sobre los distintos criterios dependiendo del objetivo del
estudio, los trminos de interaccin y las variables indicadoras.
Ejemplo 10
Estimar el efecto de los receptores de progesterona en la mortalidad de
pacientes operadas de cncer de mama. Datos: serie de 152 mujeres operadas
entre Oct 89 y Ene 92; 51 de ellas muertas por el tumor. Tenemos: las fechas de
nacimiento y ciruga, grado histolgico (1, 2 y 3), tamao del tumor (en cm),
nmero de ganglios afectados, y receptores de estrgenos y progesterona.
El modelo mximo estara formado por las variables: receptores de
progesterona (por ser la variable de inters), estrgenos, edad, tamao, grado y
nmero de ganglios (por si son variables de confusin); podemos considerar
tambin el trmino de interaccin entre los receptores de progesterona y el
tamao; como grado histolgico est codificado en 3 niveles podra ser
conveniente analizarlo a travs de 2 variables indicadoras
Para decidir si grado histolgico se introduce en el modelo como est o con
variables indicadoras, se compara el modelo que la contenga como est con
otro que tenga las indicadoras.
a) modelo con grado histolgico en una sola variable
b) modelo con grado histolgico con dos variables indicadoras
De acuerdo a la prueba del logaritmo del cociente de verosimilitudes, el modelo

ajusta ligeramente peor con las variables indicadoras, se observa tambin que la
variable no cumple la asuncin de multiplicatividad (el coeficiente de la
indicadora GRADO(2) (1,882) no es el doble del de GRADO(1) (1,398) o,
equivalentemente, el OR correspondiente a GRADO(2) (6,569) no es el
cuadrado del correspondiente a GRADO(1) (4,045), si bien la estimacin de
ambos ORs es muy imprecisa (ICs tan amplios que incluyen la desviacin de la
multiplicatividad) debido a que slo hay 10 individuos en la categora que se
est usando como referencia. En consecuencia, usaremos la variable original.
Hay que resaltar que solo hay 51 eventos, que son insuficientes para estudiar un
modelo mximo de 7 variables
Se ajusta el modelo mximo
La variable menos significativa es EDAD, la eliminamos para evaluar si es

variable de confusin.
Ni el OR de RP, ni el de RP por TAMAO han cambiado, por lo tanto EDAD no

es una variable de confusin y puede ser eliminada; la menos significativa ahora
es RP, que no puede ser eliminada en este punto (por el principio jerrquico y
por ser nuestra variable de inters), la siguiente es RE, que la eliminamos
Tampoco ahora han cambiado ni el OR de RP, ni el de RP por TAMAO, por lo

tanto RE no es una variable de confusin y puede ser eliminada; la menos
significativa ahora es RP, que por las mismas razones que antes no puede ser
eliminada y la siguiente RP por TAMAO, que es la que eliminamos (no existe
interaccin entre RP y TAMAO).
La menos significativa es GRADO
El OR de RP no ha cambiado, por tanto se puede eliminar GRADO; la menos

significativa ahora es TAMAO
que tampoco es variable de confusin y por lo tanto puede ser eliminada. La

variable GANGLIO es significativa, pero en aplicacin del principio de
parsimonia podra eliminarse del modelo si no fuera variable de confusin
Efectivamente no es variable de confusin y este ltimo ser el modelo final.

iii) Evaluacin de la fiabilidad del modelo
Una vez encontrado el mejor modelo hay que evaluar su fiabilidad, es decir,
evaluar si se comporta igual en otras muestras extradas de la misma poblacin
(reproducibilidad) y/o de otras similares (transportabilidad).
Lo veremos con detalle ms adelante
Otras lecturas
aplicaciones biomdicas de la regresin mltiple. Medicina Clnica.
2001;116:741-745.
Reglog
La colinealidad en regresin logstica

Observando la frmula para la estimacin de los coeficientes y la de la matriz de
varianzas de los mismos, se comprueba que la matriz J=XX juega, en la
regresin logstica, el mismo papel que la X'X en la regresin lineal, es decir,
hay que invertirla tanto para estimar los coeficientes como sus varianzas. Por
consiguiente, si la matriz J es singular el modelo es irresoluble y si es casisingular existen problemas de precisin numrica y estadstica, siendo, adems,
inestable la estimacin.
Aunque, estrictamente, no es un problema de colinealidad (aparece la matriz y
por lo tanto no es la colinealidad entre variables lo que hace que dicha matriz
sea singular) se sigue hablando, por analoga, de colinealidad y, lo que es ms
importante, el diagnstico de la misma se hace de la misma manera, es decir,
calculando los ndices de condicin para la matriz J, tambin escalada para que
su diagonal principal est formada por unos, y calculando a partir de los
autovectores de la misma, la matriz de descomposicin de la varianza de los
estimadores. Evidentemente, por no ser un problema de colinealidad, el factor
de inflacin de la varianza no es til ahora.
Una dificultad aadida en la regresin logstica es que la matriz J no depende
slo de los datos, sino tambin de los coeficientes del modelo (a travs de ) y
pudiera darse el caso de que, en el proceso iterativo de estimacin y para unos
ciertos valores iniciales de los coeficientes, J fuera singular en algn paso del
proceso alejado de la solucin final y que, sin embargo, si se partiera de otros
valores iniciales se pudiera acabar la estimacin sin problemas. Tambin puede
ocurrir que, debido a la falta de precisin ligada a la casi-colinealidad de algn
paso intermedio, el mtodo de Newton-Raphson no convergiera para unos
valores iniciales y, sin embargo, s convergiera para otros. En caso de que
aparezcan estos problemas, un modo de minimizarlos es, ayudndose del
diagnstico de colinealidad, intentar la estimacin con distintos valores iniciales,
incluyendo estimaciones aproximadas de los coeficientes.
Ejemplo 10
Realizar el diagnstico de colinealidad para el modelo del ejemplo 9. El SPSS
(ver 10.0) no realiza el diagnstico de colinealidad, de modo que la salida que se
presenta aqu es la del PRESTA. Para los coeficientes estimados, los ndices de
condicin y la matriz de descomposicin de varianzas son:
REGRESION LOGISTICA CON LOS COEFICIENTES
Const.: -1.6094
1.4508
CAFE: -.6932
FACTOR
AUTOVALOR
MEDIO: 1.6094
INDICE CONDICION
CAFXME:
Reglog
3.41484
1.00000
.47826
2.67211
.08687
6.26991
.02004
13.05337
PROPORCION DE VARIANZA EN LOS

FACTORES
FACTOR
Const.
CAFE
MEDIO
CAFXME
.0059
.0039
.0057
.0037
.0472
.0273
.0370
.0264
.3060
.1064
.3113
.0878
.6409
.8624
.6460
.8821
El mayor ndice de condicin es 13,05; por lo tanto para este modelo no

aparecen problemas de colinealidad.
Regresin logstica condicional

La funcin de verosimilitud a partir de la que se estiman los coeficientes del modelo
logstico, asume que los datos son una muestra aleatoria de una variable binomial
puntual. Es, junto con el modelo, la nica asuncin para la estimacin y los contrastes
de hiptesis realizados. Sin embargo, y como se ha visto en algunos ejemplos,
cuando se estudian variables binomiales con baja probabilidad (por ejemplo,
enfermedades raras) se suelen usar otros esquemas de muestreo. Sera muy poco
eficiente elegir una muestra aleatoria de la poblacin para estudiar, por ejemplo, algn
tipo de cncer, ya que se necesitara un gran tamao muestral para que hubiera
suficientes enfermos en la muestra. Es por ello por lo que se usa el esquema casocontrol o el llamado esquema apareado en el que el muestreo en las dos poblaciones
se hace introduciendo restricciones para que las muestras de ambas queden en
estratos homogneos con respecto a alguna variable ajena a las variables de inters.
Por ejemplo, y para evitar la posible confusin debida a la edad, en el problema del
ejemplo 7, se muestreara de tal modo que los enfermos y los no enfermos quedaran
en estratos homogneos segn grupos de edad, es decir, se definiran, por ejemplo, 5
grupos de edad y se muestreara independientemente para cada uno de ellos 10
enfermos y 10 no enfermos. Evidentemente, el esquema caso-control es un caso
particular del esquema apareado (un slo estrato) y la funcin de verosimilitud para
ambos tipos de estudios no es la considerada hasta ahora que se conoce como
funcin de verosimilitud no condicional y la estimacin basada en ella como
estimacin no condicional. Existe tambin la llamada funcin de verosimilitud
condicional aplicable a los estudios apareados.
Conviene destacar que, no obstante, se puede demostrar que en los diseos casocontrol, si las probabilidades de elegir a los individuos en ambos grupos son
independientes de las variables independientes del modelo, las estimaciones, tanto de
los coeficientes como de su matriz de varianzas, a partir de las funciones de
verosimilitud condicional y no condicional producen los mismos resultados, aunque,
como ya se ha dicho en este caso el coeficiente 0 no tiene ningn significado. Hay
que destacar tambin el riesgo de sesgo en la estimacin si no se cumple la condicin
anterior (y no siempre es fcil de cumplir), sobre todo cuando el tamao muestral es
pequeo.
En la prctica, debido al enorme tiempo de clculo necesario, la funcin condicional
slo se usa para estudios apareados y para estudios caso-control de pequeo tamao
muestral. Para estudios caso-control de tamao muestral grande se usa la estimacin
no condicional. El lmite entre qu se entiende aqu por grande y pequeo lo establece
el tiempo de clculo.
Ejemplo 11
Un diseo tpico de un estudio apareado es el siguiente: para estudiar, p.e., la
asociacin entre la hepatitis B y el consumo de alcohol se seleccionan al azar 10
enfermos de hepatitis y para cada uno de ellos se selecciona tambin al azar 2
personas no enfermas con su mismo sexo y edad (es una manera de evitar que
influyan en el resultado los distintos hbitos alcohlicos de los distintos grupos de
edad y sexo) y para todos ellos se registra el consumo diario de alcohol en gramos y
el consumo de otras drogas como 0: no y 1: s. Se han creado, por tanto, 10 estratos y
en cada uno de ellos el muestreo es independiente, por tanto la funcin de

verosimilitud a usar es la condicional. Unos resultados hipotticos, codificando 0:
hepatitis y 1: no hepatitis, pueden ser:
hepatitis
alcohol
drogas
estrato
15
10
70
20
30
40
40
10
20
50
30
10
20
80
20
30
50
35
10
60
10
90
65
30
10
10
10
40
10
Para realizar el anlisis de estos datos usando regresin logstica condicional (con el
PRESTA) y con una estrategia hacia adelante se empezara con el modelo simple:
NOMBRE DE LOS DATOS: hepati
VARIABLE DEPENDIENTE: HEPA
NUMERO DE VARIABLES INDEPENDIENTES: 1 A SABER
ALCO
NUMERO DE ESTRATOS: 10 DEFINIDOS POR ESTRA
NUMERO MAXIMO DE ITERACIONES: 20
CONVERGENCIA OBTENIDA EN 6 ITERACIONES
VARIABLE
ALCO
ALFA
EXP(ALFA)
EE. ALFA
Ji2
.06021
1.06206
.02824
4.54553
.03116
LOG. MAX. VEROSIMILITUD=

-6.78267
Ji-Cuadrado= 8.40690
G.L.= 1
p= .00387
INTERVALOS DE CONFIANZA AL 95% DE LOS "ODDS RATIO"
ALCO 1.00487
1.12251
Se encuentra una asociacin significativa tanto con la prueba de Wald como con la del
logaritmo del cociente de verosimilitudes. Ntese que el odds ratio de 1,06 es por
aumento de 1 gramo en el consumo diario de alcohol.
Se ajusta ahora a un modelo que contenga tambin el consumo de otras drogas y, en
aplicacin del principio jerrquico, el trmino de interaccin (una variable que sea el
producto de las variables drogas y alcohol) entre ambas.
ALCO DROGA ALXDRO
VARIABLE
ALCO
DROGA
ALXDRO
ALFA
EXP(ALFA)
EE. ALFA
Ji2
.04189
1.04278
.03264
1.64746
.19615
-1.27025
.28076
4.20961
.09105
.76070
.14089
1.15129
.19227
.53691
.52955
LOG. MAX. VEROSIMILITUD= -3.73498

Ji-Cuadrado modelo anterior= 6.09539
G.L.= 3
G.L.= 2
p= .00247
p= .04620
Comparando ambos modelos con la prueba del logaritmo del cociente de

verosimilitudes, este ltimo modelo es significativamente mejor que el anterior
(p=0,0462) aunque ninguna de las dos nuevas variables por separado lo sea. Como la
variable de interaccin no es significativa se quitara, y se ajustara este otro modelo:
ALCO DROGA
VARIABLE
ALCO
DROGA
ALFA
EXP(ALFA)
EE. ALFA
Ji2
.04874
1.04994
.03298
2.18412
.13515
2.16908
8.75026
1.12496
3.71771
.05089
LOG. MAX. VEROSIMILITUD= -4.19040

G.L.= 2
Ji-Cuadrado modelo anterior= .91086 G.L.= 1
p= .00128
p= .65808

ALCO .98423
1.12005
DROGA .96479
79.36140
La significacin global del modelo ha mejorado aunque ambos modelos no son

significativamente diferentes (p=0,65808); si se compara este ltimo con el primero
con la prueba del logaritmo del cociente de verosimilitudes W=2(-4,1904-(6,78267))=5,18454 p=0,02161; por lo tanto este modelo es mejor que el primero
que slo contena el alcohol, y aunque la prueba de Wald para DROGA est en el
borde (p=0,05089), se aceptara ste como mejor modelo. El objetivo del estudio es,
sin embargo, encontrar la asociacin con el alcohol, por consiguiente la variable
DROGA slo interesa como factor de confusin, con independencia de su significacin
estadstica, en este sentido se aprecia una ligera disminucin de la asociacin
(OR=1,04994 en el ltimo modelo frente a OR=1,06206 del primero) junto a la
desaparicin de su significacin estadstica (con tan pocos datos puede tratarse de un
problema de potencia). El investigador deber decidir si este cambio constituye un

efecto de confusin y en caso contrario volver al primer modelo.
Evaluacin de los modelos de regresin logstica
Evaluacin de los modelos de regresin logstica (no condicional)

Como en regresin lineal, una vez encontrado el mejor modelo, hay que
validarlo, es decir ver si trabaja igual con otros individuos distintos de aquellos
con los que se ha generado (1). Qu significa trabajar es diferente segn el
objetivo del modelo. En un modelo estimativo se trata de ver si se obtiene el
mismo odds ratio para la variable de inters. Aqu nos vamos a enfocar en los
modelos predictivos en los que validar significa ver si el modelo predice bien la
variable dependiente en un nuevo individuo. Ello implica dos conceptos
relacionados (2), validez (accuracy) y generalizabilidad (generalizability).
La validez es el grado en que las predicciones coinciden con las observaciones
y tiene dos componentes: calibracin y discriminacin. La calibracin compara el
nmero predicho de eventos con el nmero observado en grupos de individuos,
mientras que la discriminacin evala el grado en que el modelo distingue entre
individuos en los que ocurre el evento y los que no. Por ejemplo, se ha ajustado
un modelo logstico para predecir muerte en la UCI (3), si la mortalidad
observada en la muestra es 27%, el modelo estar perfectamente calibrado si
predice una mortalidad de 27%, sin embargo podra no distinguir entre los
pacientes que mueren y los que sobreviven. A la inversa, si el modelo asignara
una probabilidad de muerte de 2% a todos los pacientes que sobreviven y una
probabilidad de 4% a todos los que mueren, el modelo tendra una perfecta
discriminacin, pero estara pobremente calibrado.
La generalizabilidad es la capacidad del modelo de realizar predicciones vlidas
en individuos diferentes de aquellos en los que se ha generado y tiene tambin
dos componentes: reproducibilidad (capacidad del modelo de realizar
predicciones vlidas en individuos no incluidos en la muestra con la que se ha
generado, pero procedentes de la misma poblacin) y transportabilidad
(capacidad de realizar predicciones vlidas en pacientes procedentes de una
poblacin distinta pero relacionada).
La reproducibilidad, por tanto, se evaluar en otras muestras obtenidas de la
misma poblacin, o usando tcnicas de re-muestreo (2) en la misma muestra,
o dividiendo aleatoriamente la muestra en dos grupos: en uno de ellos (grupo de
trabajo) se ajusta el modelo y en el otro (grupo de validacin) se valida. La
transportabilidad exigir una muestra de la otra poblacin.
La prueba estadstica que evala la calibracin es la de Hosmer-Lemeshow,
aplicada sobre la misma muestra de trabajo (validez interna) o sobre la muestra,
o el grupo, de validacin (generalizabilidad). Si el modelo no estuviera bien
calibrado puede adaptarse mediante una regresin logstica cuya nica variable
independiente es el logit, es decir la expresin ln(p/q), del modelo original (3).
Una vez adaptado es preciso evaluar de nuevo su calibracin.
Como medida de discriminacin se utiliza el rea bajo la curva ROC que
representa para todos los pares posibles de individuos formados por un
Evaluacin de los modelos de regresin logstica
individuo en el que ocurri el evento y otro en el que no, la proporcin de los que
el modelo predice una mayor probabilidad para el que tuvo el evento. A partir de
un rea de 0,7 la discriminacin del modelo se considera aceptable.
1. What do we mean by validating a prognostic model? Altman DG, Royston P.
Statist Med. 19: 453-473. 2000.
2. Assessing the generalizability of prognostic information. Justice AC. et al. Ann
Intern Med. 130: 515-524. 1999.
3. Utilizacin de los modelos probabilsticos de mortalidad (MPM II) para evaluar
la efectividad de la atencin a pacientes en estado crtico. Ru Monn M. et al.
Med Clin (Barc). 106: 565-570. 1996.
REGRESIN DE POISSON
REGRESIN DE POISSON
V. Abraira
Bibliografa:
V. Abraira, A.Prez de Vargas
Variables de Poisson
Una variable es de Poisson cuando es el nmero de eventos que ocurren en un
intervalo temporal o espacial de tamao dado (s), cumpliendo las siguientes
condiciones:
el nmero de eventos que ocurren en el intervalo es independiente del
nmero de los que ocurren fuera del mismo.

existe un intervalo lo suficientemente pequeo, de tamao h, para el que
la probabilidad de que en el mismo ocurra un slo evento es proporcional al
tamao del intervalo, es decir es h, siendo por tanto (constante) la
probabilidad de que ocurra un evento en un intervalo de tamao unidad.
la probabilidad de que en cualquier intervalo de tamao h ocurran dos o
ms eventos, es prcticamente 0.
Ejemplos de este tipo de variables, con intervalos temporales, son: nmero de

llamadas que recibe una central telefnica en una hora, nmero de accidentes,
durante un ao, en un cruce de carreteras, nmero de mutaciones que perduran en
una especie, durante un milenio. Ejemplos con intervalos espaciales: nmero de
clulas en el campo del microscopio; nmero de bacterias patgenas en un
estanque, etc.
A veces se usan variables de Poisson con "intervalos" que no son espaciales ni
temporales sino de otro tipo. Por ejemplo, para medir la frecuencia de una
enfermedad se puede contar, en un tiempo dado, el nmero de enfermos en una
cierta poblacin, dividida en "intervalos" de, por ejemplo, 10.000 habitantes. Al
nmero de personas enfermas en una poblacin de tamao prefijado, en un
instante de tiempo, se le denomina prevalencia de la enfermedad en ese
instante y es, por tanto, una variable de Poisson. Otra medida para la frecuencia
de una enfermedad, es la incidencia, que es el nmero de personas que
enferman en una poblacin susceptible de enfermar, en un periodo de tiempo
determinado. En este caso el intervalo es de personas-tiempo, habitualmente
personas-ao, y es tambin una variable de Poisson. Habitualmente ambas
medidas se expresan para intervalos de tamao unidad, o dicho de otro modo,
http://www.hrc.es/bioest/Poisson_1.html (1 of 2) [02/01/2003 01:34:49]
REGRESIN DE POISSON
en lugar de la variable nmero de enfermos, se usa el parmetro (el riesgo, en

el caso de la prevalencia, y la densidad de incidencia, en el de incidencia).
La funcin densidad de probabilidad para una variable de Poisson es:
siendo s el tamao del intervalo. La media y la varianza de esta variable son

ambas iguales a s. La variable est caracterizada por el parmetro
(probabilidad de una ocurrencia en la unidad de medida) y por el tamao del
intervalo s.
Un modelo de regresin para una variable de Poisson es un modelo que permite
estudiar si dicha variable depende, o no, de otra u otras variables. Si una
variable de Poisson de parmetro es independiente de otra variable X, se
, por consiguiente, un modelo de regresin es una funcin de
cumple
en X que a travs del coeficiente de X permite investigar la relacin anterior, y
como en los modelos lineal y logstico, fcilmente generalizable a ms variables
independientes.
Modelo de regresin de Poisson

Para una nica variable independiente X, es un modelo de la forma:
o, para simplificar la notacin, simplemente:
donde ln significa logaritmo neperiano, 0 y 1 son constantes y X una variable

que puede ser aleatoria o no, continua o discreta. Este modelo se puede
fcilmente generalizar para k variables independientes:
Por lo tanto 0 es el logaritmo de (probabilidad de que ocurra un evento en un

intervalo de tamao unidad) cuando todas las variables independientes son
cero, y i es el cambio en el logaritmo de (o logaritmo del cociente de )
cuando la variable Xi aumenta una unidad, mantenindose constantes las
dems o, dicho de otro modo,
es la probabilidad de que ocurra un evento en
el
un intervalo unidad cuando todas las variables independientes son cero y
cociente de dicha probabilidad para un aumento de una unidad en la variable Xi
(riesgo relativo). Obsrvese que, al igual que en la regresin logstica, el modelo
supone efectos multiplicativos, es decir, si la variable Xi aumenta n unidades, la
probabilidad para la variable de Poisson se multiplica por
es decir,
la potencia n-sima de
Teniendo en cuenta, que para una variable de Poisson: = s el modelo
tambin se puede poner en funcin de como:
Ejemplo
Se quiere comparar la incidencia de cncer de piel en 2 ciudades, para ello se
registran los cnceres de piel aparecidos en el ltimo ao, 18 para la ciudad A y
30 para la B, cuyas poblaciones respectivas son 350.000 y 410.000.
Se trata de variables de Poisson con intervalo de personas-tiempo. Asumiendo
que ambas poblaciones se han mantenido constantes a lo largo de ese ao y
que todos los individuos eran susceptibles de enfermar, los tamaos de los
intervalos son respectivamente 350.000 y 410.000 personas-ao y la mejor

estimacin de las densidades de incidencia:
Definiendo la variable X = 0 para la ciudad A y X = 1 para la B, estos resultados

se pueden expresar con un modelo de regresin, siendo:
el logaritmo de la densidad de incidencia en la ciudad A y

razn de densidades de incidencia, es decir:
el logaritmo de la
Por lo tanto, la densidad de incidencia en B es 1,423 la de A (42,3% ms alta).

Evidentemente, para comparar ambas incidencias, simplemente hay que
comparar
con cero o
con 1.
Se puede plantear que esta diferencia en las incidencias pueda ser debida,
simplemente, a que ambas ciudades tengan una distinta pirmide de poblacin
(es sabido que la incidencia del cncer es distinta para distintos grupos de edad)
o quizs, y sera una hiptesis ms interesante a investigar, a algn otro factor.
Si se conoce la distribucin de las poblaciones para los distintos grupos de
edad, as como el grupo al que pertenece cada enfermo, se puede plantear un
modelo:
siendo X1 la ciudad y X2 el grupo de edad. En este modelo 1 es la razn de

densidades de incidencia para ambas ciudades controlando por la edad. Si 1
es distinto de 0, se puede concluir que existe algn factor, distinto de la edad, en
ambas ciudades que incide en el cncer de piel.
Estimacin de los coeficientes de un modelo de regresin de Poisson

Para estimar los coeficientes de un modelo de Poisson se utiliza el mtodo de
mxima verosimilitud.Este procedimiento es matemticamente complejo, pero lo
que importa para el usuario es:
1 El proceso es iterativo, es decir se dan a los coeficientes unos valores
arbitrarios (habitualmente, aunque no necesariamente, el valor 0). La solucin
final no depende de estos valores
2 A partir de estos valores iniciales se construye una matriz p con los valores
previstos por el modelo para las observaciones de la variable dependiente.
3 A partir de esta matriz y de la matriz X de diseo (construida igual que en
regresin lineal), se calculan los nuevos estimadores, que se comprueba si son
ya la solucin, en cuyo caso se para el proceso y en caso contrario se repite el
proceso. En la prctica, y para evitar convergencias asintticas, tambin se para
el proceso si los nuevos estimadores difieren de los anteriores en menos de una
cierta cantidad, llamada lmite de convergencia.
En este ltimo paso hay que invertir una matriz y eso puede dar problemas de
colinearidad
Distribucin muestral de los estimadores
Hay un teorema (teorema del lmite central en la estimacin por mxima
verosimilitud) que dice estos estimadores son asintticamente normales y su
matriz de varianzas-covarianzas es
= -J -1 = -(X'pX) -1
y su estimacin se calcula, particularizando para los coeficientes estimados.
http://www.hrc.es/bioest/Poisson_3.html [02/01/2003 01:40:34]
Contrastes de hiptesis y estrategias de modelizacin en modelos de regresin de Poisson
Contrastes de hiptesis y estrategias de modelizacin

Teniendo en cuenta lo anterior los contrastes de hiptesis sobre cada coeficiente se
hacen con la prueba de Wald y los contrastes de hiptesis sobre el modelo completo,
o sobre un conjunto de coeficientes, con el logaritmo del cociente de verosimilitudes.
Por otro lado las estrategias de modelizacin son exactamente las mismas que las
vistas en los captulos previos.
Ejemplo
Supngase que en las ciudades del ejemplo anterior, la poblacin y los cnceres de
piel aparecidos se distribuyen como sigue para distintos grupos de edad:
Ciudad A
Edad
0 30
31 60
> 60
Poblacin Cncer
120.000
3
200.000
7
30.000
8
Ciudad B
Poblacin Cncer
130.000
4
220.000
10
60.000
16
Estmese, mediante un modelo de Poisson, la razn de densidades de incidencia para

ambas ciudades, controlando por la edad.
Para resolverlo con un paquete estadstico (PRESTA), se crea el siguiente archivo
con cuatro variables:
EDAD
1
2
3
1
2
3
CIUDAD POBLACION CANCER

0
120.000
3
0
200.000
7
0
30.000
8
1
130.000
4
1
220.000
10
1
60.000
16
para independizar el resultado de como cambien las densidades de incidencia entre

los distintos grupos de edad, se crean a partir de la variable EDAD dos variables
indicadoras, EDAD1 y EDAD2, con el primer esquema discutido en regresin lineal y
para estudiar la posible interaccin entre CIUDAD y EDAD, se crean las variables
CIXED1 y CIXED2 con los productos de CIUDADEDAD1 y CIUDADEDAD2
respectivamente.
El modelo completo tiene, por lo tanto, cinco variables: CIUDAD, EDAD1, EDAD2,
CIXED1 y CIXED2.
El ajuste para este modelo es:
NOMBRE DE LOS DATOS: eje2pois
VARIABLE DEPENDIENTE: CANCER
VARIABLE TAMAO: POBLA

CIUDAD
EDAD1 EDAD2 CIXED1
CIXED2
NUMERO DE CASOS: 6
CASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0
VARIABLE
ALFA
EXP(ALFA) EE. ALFA
Ji2
p
Const. -10.59663
.00003 .57735 336.86620 .00000
CIUDAD
.20764 1.23077 .76376
.07391 .78227
EDAD1
.33647 1.40000 .69007
.23775 .63158
EDAD2
2.36712 10.66666 .67700
12.22533 .00060
CIXED1
.05373 1.05520 .90895
.00349 .95139
CIXED2
-.20764
.81250 .87797
.05593 .80834
LOG. MAX. VEROSIMILITUD CON CONSTANTE SOLA= -32.88131

LOG. MAX. VEROSIMILITUD MODELO COMPLETO= -11.39070
Ji-Cuadrado modelo= 42.98121
GL= 5
p= .00000
El ajuste del modelo, con la prueba del logaritmo del cociente de verosimilitudes es
significativo. El primer contraste a realizar es sobre la interaccin. Como las variables
CIXED1 y CIXED2 son indicadoras y no tienen sentido por s solas, hay que realizarlo
globalmente para las dos con el logaritmo del cociente de verosimilitudes. Se ajusta,
por lo tanto, a un modelo sin ellas. El resultado es:
NUMERO DE VARIABLES INDEPENDIENTES:
CIUDAD EDAD1 EDAD2
3 A SABER
NUMERO DE CASOS: 6
VARIABLE
Const.
CIUDAD
EDAD1
ALFA
EXP(ALFA)
-10.55314 .00003
.13023 1.13909
.36802 1.44486
EE.
Ji2
p
ALFA
.41299 652.96970 .00000
.30131
.18681 .66947
.44909
.67153 .58226
EDAD2
2.23495 9.34601
.43171
26.80163 .00000

LOG. MAX. VEROSIMILITUD MODELO COMPLETO=
-11.47604
Ji-Cuadrado modelo=
42.81053
GL= 3
p= .00000
Ji-Cuadrado modelo anterior= .17068
GL= 2
p= .91773
No se puede rechazar la hiptesis nula de no existencia de interaccin (p=0,91773),

por lo tanto se eliminan dichas variables del modelo. Para este ltimo modelo la matriz
estimada de covarianzas de los estimadores es:
MATRIZ DE COVARIANZAS
Const.
CIUDAD
EDAD1
EDAD2
Const. CIUDAD EDAD1 EDAD2

.171
-.050
.091
-.143 -.000 .202
-.136 -.013 .143
.186
El prximo contraste a realizar es para las variables EDAD1 y EDAD2, que tambin
tiene que ser global. Se ajusta a un modelo sin ellas y el resultado es:
CIUDAD
NUMERO DE CASOS: 6
VARIABLE ALFA EXP(ALFA)EE. ALFA

Ji2
p
Const. -9.8753 .00005 .23570 1755.39400 .00000
CIUDAD
.3526 1.42276 .29814
1.39869 .23503

-32.16458
Ji-Cuadrado modelo=
1.43345
GL= 1 p= .22908
Ji-Cuadrado modelo anterior= 41.37708
GL= 2 p= .00000
Obsrvese que esta ltima estimacin coincide con la calculada anteriormente. Con la
prueba del logaritmo del cociente de verosimilitudes no se puede rechazar

(p=0,00000) que no haya efecto de la edad. En el modelo que contiene la edad, la
razn de densidades de incidencia entre las dos ciudades es 1,13909 y no es
significativamente distinta de 1 (p=0,66947 con la prueba de Wald). Ntese que la
edad es una variable de confusin (con el modelo que slo contiene la ciudad, la
estimacin es 1,42276) y por tanto el modelo adecuado para hacer las estimaciones
es el que contiene la edad. El intervalo de confianza al 95%, tambin calculado por el
programa, aunque en la salida anterior no se presenta, es (0,631, 2,056).
Para estimar, por ejemplo, con ese modelo la densidad de incidencia para el grupo de
mayores de 60 aos en la ciudad B, recurdese que para la ciudad B, CIUDAD=1 y
para ese grupo de edad, EDAD1=0 y EDAD2=1, por lo tanto segn el modelo:
obsrvese que, como el ajuste del modelo es muy bueno, coincide con la estimacin
que se puede obtener directamente de los datos:
pero el modelo permite, adems, calcular un intervalo de confianza para dicha

estimacin. Para ello hay que calcular:
su error estndar es
y por lo tanto el intervalo de confianza al 95% es
y del mismo modo para los otros grupos de edad y/o la otra ciudad.
Otras lecturas
aplicaciones biomdicas de la regresin mltiple. Medicina Clnica. 2001;116:741-745.
La colinealidad en la regresin de Poisson

Del mismo modo que en la regresin logstica, para estimar los coeficientes hay
que invertir la matriz J = XpX siendo adems la inversa de J la matriz de
varianzas-covarianzas de los mismos. Por consiguiente, si dicha matriz es
singular el modelo es irresoluble y si es casi-singular existen problemas de
precisin numrica y estadstica, siendo, adems, inestable la estimacin. Como
entonces, aunque no es un problema de colinealidad en sentido estricto se sigue
hablando, por analoga, de colinealidad y, tambin, el diagnstico de la misma
se hace de anloga manera, es decir, calculando los ndices de condicin para
la matriz J tambin escalada para que su diagonal principal est formada por
unos, y calculando a partir de los autovectores de la misma, la matriz de
descomposicin de la varianza de los estimadores. Evidentemente, por no ser
un problema de colinealidad, el factor de inflacin de la varianza tampoco es til
ahora.
Tambin en el caso de la regresin de Poisson, y a diferencia de la regresin
lineal, la matriz J no depende slo de los datos, sino tambin de los coeficientes
del modelo (a travs de p) y pudiera darse el caso de que, en el proceso
iterativo de estimacin y para unos ciertos valores iniciales de los coeficientes, J
fuera singular en algn paso del proceso alejado de la solucin final y que, sin
embargo, si se partiera de otros valores iniciales se pudiera acabar la estimacin
sin problemas. Tambin puede ocurrir que, debido a la falta de precisin ligada a
la casi-colinealidad de algn paso intermedio, el mtodo de Newton- Raphson
no convergiera para unos valores iniciales y, sin embargo, si convergiera para
otros. En caso de que aparezcan estos problemas, un modo de minimizarlos es,
ayudndose del diagnstico de colinealidad, intentar la estimacin con distintos
valores iniciales, incluyendo estimaciones aproximadas de los coeficientes
(obtenidas, por ejemplo, a partir del mtodo usado en el ejemplo).
Hay que tener en cuenta, tambin, que debido a los grandes valores que suele
tener la variable s, tamao del intervalo, en algunos modelos (en el ejemplo
desarrollado en este texto son cientos de miles, pero en problemas de
estimacin de tasas de mortalidad por pases puede ser de decenas o centenas
de millones) pueden aparecer problemas de precisin o, incluso, desbordes (se
denomina as al hecho de que un nmero sea mayor que la capacidad de la
porcin de memoria reservada en el ordenador para almacenarlo) en los
algoritmos de estimacin. En estos casos se puede dividir dicha variable por una
constante adecuada, es decir, se expresa la poblacin en miles de personas o
en centenas de miles, entonces el parmetro queda multiplicado por ese
mismo factor, pero en el modelo ese cambio slo afecta a 0 (se le sumar el
logaritmo de dicha constante) y no al resto de los coeficientes. Si en el ejemplo
anterior se divide la poblacin por 1.000, los modelos encontrados sern
exactamente los mismos excepto el coeficiente 0 al que se le sumar
ln1.000=6,908.
Ejemplo
Los salida del PRESTA del diagnstico de colinealidad para el modelo del
ejemplo anterior en el que se ha dividido la poblacin por 1.000 es:
REGRESION POISSON CON LOS COEFICIENTES:
Const.: -3.6454 CIUDAD: .1302 EDAD1: .3680
EDAD2 : 2.2350
FACTOR AUTOVALOR
1
2
3
4
PROPORCION DE VARIANZA
FACTOR
1
2
3
4
INDICE
CONDICION
2.64356
1.00000
1.00497
1.62188
.27931
3.07646
.07216
6.05269
EN LOS FACTORES
Const. CIUDAD
.0163 .0423
.0003 .0014
.0375 .8924
.9459 .0639
EDAD1
.0140
.1838
.0586
.7436
EDAD2
.0182
.0802
.1435
.7581
Donde, con los criterios discutidos regresin lineal, no se aprecian problemas de

colinealidad.
Relacin entre los modelos de Poisson y logstico
El intervalo s en el que est definida una variable de Poisson se puede dividir en

un conjunto de n subintervalos de tamao h, cada uno de los cuales es tan
pequeo que en ellos slo puede ocurrir, a lo sumo, un evento, y la probabilidad
de que ocurra es la constante . Por lo tanto, en cada uno de estos intervalos, el
nmero de eventos que ocurren es 0 1, con probabilidades 1 - y
respectivamente, es decir, es una variable binomial puntual. Una variable de
Poisson es, en consecuencia, la suma de n variables binomiales puntuales, es
decir, es una variable binomial de parmetros n y . Como no hay una manera
nica de elegir los subintervalos, el parmetro n no est bien definido, sin
embargo, el tamao h tiene que ser suficientemente pequeo, por lo tanto n ser
grande.
En consecuencia, todos los problemas que se pueden plantear con un modelo
de Poisson, tambin se pueden plantear con un modelo logstico, si se dispone
de los datos individualizados y, como era de esperar, se obtiene el mismo
resultado. Hay que tener en cuenta, no obstante, que el modelo logstico
modeliza el odds, mientras que el de Poisson modeliza la probabilidad, por lo
tanto los coeficientes slo coincidirn cuando la probabilidad sea pequea.
Ntese que la inversa no siempre es cierta, hay problemas que se pueden
plantear con un modelo logstico y no con un modelo de Poisson, como por
ejemplo, un estudio caso-control, en el que la probabilidad no se puede estimar
(por tanto, tampoco modelizar) y, sin embargo, s se puede el odds ratio.
Ejemplo
En un estudio para establecer la eficacia de una vacuna contra la gripe en dos

grupos de edad, se mide, durante una semana de invierno, la prevalencia de la
misma en dos muestras aleatorias de individuos vacunados y no vacunados en los
dos grupos de edad. Se obtienen los siguientes resultados:
Vacunados
Edad
20 - 60
> 60
Total
80
50
Gripe
3
5
No
vacunados
Total Gripe
91
5
43
10
El nmero de individuos con gripe en cada una de las situaciones es una variable
de Poisson, para la que se puede plantear un modelo de regresin. Para cada
individuo, el tener, o no, gripe, es una variable binomial puntual para la que se
puede plantear un modelo logstico.
Para ajustar a un modelo Poisson hay que partir de un archivo como el

siguiente:
EDAD VACUNA TOTAL GRIPE
0
1
80
3
1
1
50
5
0
0
91
5
1
0
43
10
Para ajustar a un modelo logstico hay que crear un archivo en que cada
individuo sea una observacin. Sera:
EDAD VACUNA GRIPE
0
1
1
3 observaciones: individuos vacunados, edad 20
- 60, con gripe
0
1
0
77 observaciones: individuos vacunados, edad 20
- 60, sin gripe
1
1
1
5 observaciones: individuos vacunados, edad >60,
con gripe
1
1
0
45 observaciones
0
0
1
5 observaciones
0
0
0
86 observaciones
1
0
1
10 observaciones
1
0
0
33 observaciones
y los ajustes correspondientes:
REGRESION DE POISSON
VARIABLE DEPENDIENTE: GRIPE
VARIABLE TAMAO: TOTAL
EDAD
VACUNA
NUMERO DE CASOS: 4
VARIABLE ALFA EXP(ALFA) EE. ALFA

Ji2
p
Const. -2.79827 .06092 .37835 54.70174 .00000
EDAD
VACUNA
1.28379 3.61029
-.68495 .50412
.43865
.43865
8.56527 .00357
2.43822 .11406

-7.18156
GL= 2
p= .00410
INTERVALOS DE CONFIANZA AL 95% DE LOS EXP(ALFA)
EDAD
1.52810
8.52966
VACUNA .21337
1.19102
El riesgo relativo para la vacuna, controlado por la edad, es 0,50412 (la

probabilidad de que un individuo vacunado contraiga la gripe es
aproximadamente la mitad que la de un individuo sin vacunar) con un intervalo
de confianza de (0,21337, 1,19102), por lo tanto, no es significativamente
distinto de 1.
REGRESION LOGISTICA INCONDICIONAL
NOMBRE DE LOS DATOS: eje52poi
VARIABLE DEPENDIENTE: GRIPE
EDAD
VACUNA
NUMERO DE CASOS: 264
VARIABLE ALFA EXP(ALFA)EE. ALFA

Ji2
p
Const. -2.71567 .06616 .38959 48.58808 .00000
EDAD
1.43544 4.20149 .46417 9.56352 .00217
VACUNA
-.78082 .45803 .46780 2.78598 .09094
-71.93247
GL= 2
p= .00230
EDAD
1.69159
10.43545
VACUNA .18310
1.14577
El odds ratio para la vacuna es 0,45803 y tampoco es significativamente distinto

de 1. En este caso, y como la probabilidad de contraer la gripe no es pequea,
ambos estimadores no coinciden. Sin embargo, si se calcula por ejemplo, la
probabilidad de que una persona mayor de 60 aos y no vacunada contraiga la
gripe con el modelo de Poisson:
y con el modelo logstico:
que como se observa, s coinciden.
http://www.hrc.es/bioest/Supervivencia_1.html
ANLISIS DE SUPERVIVENCIA
V. Abraira
Bibliografa:
E.T.Lee
Statistical Methods for Survival Data Analysis
Lifetime Learning Publications. 1980.
J.D.Kalbfleisch, R.L.Prentice
The Statistical Analysis of Failure Time Data
John Wiley & Sons. 1980.
Introduccin
Se denomina anlisis de supervivencia al conjunto de tcnicas que permiten
estudiar la variable tiempo hasta que ocurre un evento y su dependencia de
otras posibles variables explicatorias. Por ejemplo, en el estudio de
enfermedades crnicas o tratamientos muy agresivos, el tiempo hasta que
ocurre la muerte del enfermo (tiempo de supervivencia) y su dependencia de la
aplicacin de distintos tratamientos, pero en otras enfermedades, el tiempo
hasta la curacin, o el tiempo hasta la aparicin de la enfermedad. En procesos
de control de calidad se estudia el tiempo hasta que un cierto producto falla
(tiempo de fallo), o el tiempo de espera hasta recibir un servicio (tiempo de
espera), etc.
Debido a que la variable tiempo es una variable continua podra ser, en
principio, estudiada mediante las tcnicas de anlisis de la varianza o los
modelos de regresin. Hay, sin embargo, dos dificultades importantes para este
planteamiento. En primer lugar, en la mayor parte de los estudios citados la
variable tiempo no tiene una distribucin normal, ms bien suele tener una
distribucin asimtrica y aunque podran intentarse transformaciones que la
normalizaran, existe una segunda dificultad que justifica un planteamiento
especfico para estas variables, y es que para observarlas se tiene que
prolongar el estudio durante un perodo de tiempo suficientemente largo, en el
cual suelen ocurrir prdidas, que imposibilitan la observacin del evento.
Existen tres motivos por los que pueden aparecer estas prdidas, en primer
lugar por fin del estudio. Supngase, por ejemplo, que para evaluar una
intervencin quirrgica arriesgada se sigue en el tiempo, durante un ao, a dos
grupos de pacientes. A los de un grupo se les practic la intervencin y a los de
otro no, y se registr la duracin del intervalo de tiempo entre la intervencin (o
la entrada en el estudio, para el grupo no intervenido) y la muerte. Al final del
estudio puede haber individuos que no hayan muerto. Otra causa es la prdida
propiamente dicha, por ejemplo se quiere evaluar la eficacia de un tratamiento
http://www.hrc.es/bioest/Supervivencia_1.html (1 of 3) [02/01/2003 01:50:23]
preventivo para el SIDA, y se sigue durante cinco aos a individuos VIH+.

Algunos de los individuos, y puede ser un nmero importante, desaparecern
del estudio en algn momento del mismo por diversos motivos: cambio de
domicilio, falta de inters, etc. Una ltima causa de prdida es la ocurrencia de
un evento competitivo, en los ejemplos anteriores puede ser muerte por alguna
otra causa ajena al estudio. Aunque los ejemplos anteriores son del mbito de
Ciencias de la Salud, estos mismos problemas aparecen en cualquier estudio
que necesite un largo tiempo de observacin.
Hay que tener en cuenta tambin que la variable es el tiempo hasta que ocurre
un evento, y est definida por la duracin del intervalo temporal entre los
instantes en que empieza la observacin y ocurre el evento. En los ejemplos
citados, la observacin no comienza en el mismo instante para todos los
individuos. En algunos textos se denomina prdida por la izquierda a esta no
coincidencia de los tiempos en que comienza la observacin, ya que, si el
estudio est diseado para acabar en un tiempo determinado, el efecto de esta
no coincidencia es reducir, para los que empiezan ms tarde, el tiempo de
observacin. En el esquema de la figura se detallan todas las posibles prdidas.
Evidentemente, se pueden evitar las prdidas por la izquierda diseando el
estudio para que acabe, no en un tiempo establecido con carcter general, sino,
para cada individuo, en un tiempo determinado despus del inicio de la
observacin.
Esquema temporal de un estudio para observar tiempos de espera para un evento,

por ejemplo supervivencia en una intervencin quirrgica. Con el crculo se
representan las prdidas y con el cuadrado las muertes (ocurrencia del evento). El
individuo A desaparece del estudio 3 meses despus de la intervencin (sera una
prdida en sentido estricto). El B fallece a los 2,5 meses. El C sigue vivo al
acabar el estudio (sera una prdida a los 12 meses por fin del estudio). El D, al
que se le interviene en el mes 1, fallece en el 9, el tiempo de supervivencia sera 8
meses (hay 1 mes de prdida por la izquierda). El E, al que se le interviene en el
mes 2, se pierde en el 7 (sera una prdida a los 5 meses, ya que hay prdida en
sentido estricto y prdida por la izquierda). El F, al que se le interviene en el mes
6, sigue vivo al acabar el estudio, sera una prdida a los 6 meses (existe prdida
por fin del estudio y prdida por la izquierda).
Si se quisiera aplicar un modelo de regresin lineal a un estudio de este tipo,
habra que eliminar del mismo las observaciones perdidas, ya que para ellas no
se conoce el valor de la variable; sin embargo s se tiene alguna informacin til
sobre la misma: se sabe que es mayor que el tiempo en el que se produjo la
prdida.
Distribucin de la variable tiempo de espera
Distribucin de la variable tiempo de

espera
La variable tiempo de espera es una variable aleatoria continua y no negativa,
cuya funcin de probabilidad puede especificarse de varias maneras. La primera
es la habitual funcin densidad de probabilidad f(t), y relacionadas con ella, la
funcin de supervivencia S(t) y la funcin de riesgo h(t).
La funcin densidad de probabilidad f(t) para una variable continua se define
como una funcin que permite calcular la probabilidad de que la variable tome
valores en un intervalo a travs de la frmula:
La funcin de supervivencia S(t) se define como:
Por lo tanto, la funcin de supervivencia da la probabilidad complementaria de la

habitual funcin de distribucin acumulativa F(t) = P(T t), es decir S(t) = 1 F(t).
Otro modo de expresar la probabilidad para la variable tiempo de espera es por
medio de la funcin de riesgo h(t) que es la funcin de densidad de probabilidad
de T, condicionada a que T t. Por ejemplo, para la supervivencia a una
intervencin quirrgica, la funcin de riesgo a los 2 aos es la de densidad de
probabilidad de morir a los 2 aos de la intervencin, condicionada a que ya se
ha sobrevivido hasta entonces. Esta probabilidad sera, realmente, la que en
cada momento le importa al enfermo intervenido.
Se puede demostrar que
A veces se usa tambin la funcin de riesgo acumulada H(t), ms difcil de

interpretar, que se define como
y que verifica
Es decir, las cuatro funciones estn relacionadas; si se conoce una cualquiera de

ellas, se pueden obtener las dems.
A pesar de que el tiempo es una variable continua, un observador slo tiene
acceso a valores discretos de la misma. Los datos observados para cualquiera
de las experiencias descritas en la introduccin son una serie de valores
discretos. Conviene, por lo tanto, definir las funciones anteriores en el caso
(prctico) de considerar a la variable tiempo como discreta, es decir, como un
conjunto discreto de valores t1 < t2 < El suponerlos ordenados de menor a
mayor no representa ninguna prdida de generalidad, de hecho es as como se
observa el tiempo.
Para una variable discreta, la funcin densidad de probabilidad f (t) se define
como:
y la funcin de supervivencia:
La funcin de supervivencia da, por lo tanto, para cada valor ti de T, la

probabilidad de que la variable T sea mayor o igual que ti (en este caso no es la
complementaria de la funcin de distribucin puesto que la probabilidad de que
T sea igual a ti, que en las variables discretas en general no es cero, est
incluida en ambas funciones), aunque otros textos, justamente para que siga
siendo la complementaria de la funcin de distribucin la definen sin incluir el
igual.
Las funciones de riesgo y riesgo acumulado para una variable discreta tambin
son:
Estimacin de la funcin de supervivencia (mtodo de Kaplan-Meier)
Estimacin de la funcin de supervivencia (mtodo de Kaplan-Meier).

Es un mtodo no paramtrico (no asume ninguna funcin de probabilidad) y por
mxima verosimilitud, es decir se basa en maximizar la funcin de verosimilitud
de la muestra. Una muestra aleatoria de tamao n, extrada de una poblacin,
estar formada por k (k n) tiempos t1 < t2 < < tk en los que se observan
eventos. En cada tiempo ti existen ni "individuos en riesgo" (elementos de la
muestra para los que el evento puede ocurrir, o que T ti) y se observan di
eventos. Adems en el intervalo [ti, ti+1) se producen mi prdidas.
Se puede demostrar que la funcin de verosimilitud para toda la muestra es:
Para construir esta funcin se ha asumido que la informacin contenida en las

prdidas es que, para cada una de ellas, el evento ocurre en un tiempo mayor
que el tiempo en que se observa la prdida. Maximizando esta funcin se
encuentra que el estimador de la funcin de riesgo es
y para la funcin de supervivencia, el denominado estimador producto lmite o

de Kaplan-Meier:
Ejemplo 1
Se sigue en el tiempo a 12 individuos con una prtesis cardaca y se encuentran
los siguientes tiempos de supervivencia en aos: 6*, 6, 6, 6, 10, 12*, 12, 15, 15*,
17, 22, 22, donde el asterisco indica prdida; es decir se perdieron 3 individuos
en los tiempos 6, 12 y 15. La manera ms cmoda de calcular los estimadores
anteriores es disponer los datos en una tabla como la que sigue:
tiempo ind. en riesgo eventos

6
12
F. riesgo F. supervivencia
3/12=0,25
10
1/8=0,125
0,750
12
1/7=0,143
0,656
15
1/5=0,2
0,562
17
1/3=0,333
0,450
22
2/2=1
0,300
Para analizar estos datos con un paquete estadstico, por ejemplo el SPSS, hay
que introducir dos variables: el tiempo y el status con un cdigo que indique si
en ese tiempo se ha producido el evento o es una perdida. La salida es
Survival Analysis for TIEMPO
Time
Cumulative
Events
Status
Number
Cumulative
Standard
Survival
Error
Remaining
6
1
11
1
2
6
3
10
,7500
,1250
,6563
,1402
,5625
,1482
,4500
,1555
,3000
,1605
,0000
,0000
9
6
0
8
10
4
7
12
6
12
0
5
15
6
1
4
15
6
0
3
17
7
1
2
22
8
1
1
22
9
1
0
Number of Cases:
12
Censored:
( 25,00%)
Events: 9
En la tercera columna (Cumulative Survival) aparece la funcin de

supervivencia (S(t)) en todos los tiempos en los que ocurren eventos. Esta
funcin se suele representar en una grfica como
El SPSS tambin calcula y representa la grfica de la funcin de riesgo

acumulada (que en su versin en espaol denomina Impacto).
Varianza de los estimadores de las funciones de riesgo y supervivencia
Varianza de los estimadores

Usando resultados asintticos (para grandes muestras) de la teora de estimacin
por mxima verosimilitud se obtiene que la varianza de los estimadores de la
funcin de riesgo es
y a partir de aqu, una expresin aproximada para la varianza de la funcin de

supervivencia es (frmula de Greenwood)
Teniendo en cuenta la normalidad asinttica de los estimadores de mxima

verosimilitud, se pueden calcular intervalos de confianza al (1 )% para estas
estimaciones:
Por ejemplo, para los datos del ejemplo 1, las varianzas de las estimaciones de
la funcin de supervivencia y los intervalos de confianza al 95% construidos con
ellas son:
Tiempo
6
10
12
15
17
22
F.
superv.
0,7500
0,6563
0,5625
0,4500
0,3000
0,0000
Varianza
0,0156
0,0197
0,0220
0,0242
0,0257
-
Intervalo de
confianza
0,9950 0,5050
0,9310 0,3815
0,8530 0,2720
0,7548 0,1452
0,6145 - 0,0145
-
En la salida del SPSS figura, en lugar de la varianza, su raz cuadrada (el error
estndar), que es posible guardar en una nueva variable del archivo para, a
partir de ella y la funcin de supervivencia construir los intervalos de confianza.
y se obtiene
Una representacin grfica de la funcin de supervivencia y su intervalo de

confianza (obtenida con el programa AlcEst) es
Obsrvese que cuando para un tiempo ocurre el evento para todos los individuos
en riesgo, como en este caso para 22, la varianza est indeterminada (aunque el
SPSS pone 0) puesto que el denominador es 0. Por otro lado, en los tiempos
extremos el intervalo de confianza puede sobrepasar el intervalo [0,1], en este
caso en el tiempo 17. Ello es debido a que la frmula de la varianza es slo
aproximada y a que la normalidad es asinttica. Este problema se puede evitar
de normalidad tambin asinttica
usando una transformacin logartmica de
pero cuyo campo de variacin es todo el campo real.
A partir de la funcin
cuyo varianza es
se construyen los intervalos de confianza para S(ti)
para los datos del ejemplo 1 por este procedimiento se obtienen los intervalos
de confianza al 95% dados en la siguiente tabla:
Tiempo
F. superv.
Varianza
6
10
12
15
17
22
0,7500
0,6563
0,5625
0,4500
0,3000
0,0000
0,0156
0,0197
0,0220
0,0242
0,0257
-
Intervalo de
confianza
0,9117
0,4084
0,8557
0,3204
0,7910
0,2437
0,7104
0,1549
0,6041
0,0564
-
Mtodo actuarial
Mtodo actuarial
Hay ocasiones en que no se dispone de observaciones individuales de los
eventos, sino de observaciones agrupadas por intervalos temporales o, incluso,
aunque se disponga de las mismas se agrupan para compactar su presentacin.
Por ejemplo, los datos de mortalidad para un pas durante una dcada se suelen
agrupar en intervalos anuales, en las denominadas tablas de vida o actuariales,
de modo que no se dispone del tiempo de fallecimiento de cada individuo, sino
del nmero de fallecidos en cada intervalo, en este caso anual.
Supngase que hay k intervalos, al principio de cada intervalo Ii, existen ni
individuos en riesgo, y durante el mismo se producen mi prdidas y di eventos.
Por lo tanto, en el conjunto del intervalo el nmero de individuos en riesgo es
variable, asumiendo que las prdidas se producen homogneamente a lo largo
del mismo, su nmero promedio es ni mi /2 y, en consecuencia, el estimador
del riesgo para el intervalo ser:
sustituyendo este valor en las frmulas previas, es decir cambiando en las

mismas ni por ni - mi/2 se obtienen los estimadores para la funcin de
supervivencia y su varianza. A este mtodo se le conoce como mtodo actuarial.
Con los datos del ejemplo 1, definiendo intervalos de 5 aos, las tablas de vida,
obtenidas con el SPSS, son
This subfile contains:
Life Table
Survival Variable
12 observations
Number
Entrng
Intrvl
ProbaStart
this
bility Hazard
Time
Intrvl
Densty
Rate
------ -------- -----,0
12,0
,0000
,0000
5,0
12,0
,0522
,0600
10,0
8,0
,0394
,0615
15,0
5,0
TIEMPO
Number
Wdrawn
Number
Exposd
Number
of
Propn
Propn
Cumul
Propn
During
to
Termnl
Termi-
Sur-
Surv
Intrvl
Risk
Events
nating
viving
at End
------
------
------
------
------
------
,0
12,0
,0
,0000
1,0000
1,0000
1,0
11,5
3,0
,2609
,7391
,7391
1,0
7,5
2,0
,2667
,7333
,5420
1,0
4,5
2,0
,4444
,5556
,3011
---
Mtodo actuarial
,0482
20,0
,0602
,1143
2,0
,4000
,0
2,0
2,0
1,0000
The median survival time for these data is
Intrvl
Start
Time
------,0
5,0
10,0
15,0
20,0
SE of
Cumul
Surviving
-----,0000
,1295
,1525
,1526
,0000
SE of
Probability
Densty
-----,0000
,0259
,0248
,0288
,0305
,0000
,0000
15,87
SE of
Hazard
Rate
-----,0000
,0342
,0430
,0774
,0000
Donde la primera columna (Intrvl Start Time) contiene el tiempo inicial

del intervalo; la segunda (Number Entrng this Intrvl) el nmero de
individuos en riesgo al inicio del intervalo (ni); la siguiente (Number Wdrawn
this Intrvl) el nmero de prdidas (mi); la siguiente (Number Exposd to
Risk) el nmero de individuos en riesgo en el intervalo (ni mi /2); la siguiente
(Number of Termnl Events) el nmero de eventos (di); la siguiente
(Propn Terminating) la funcin de riesgo (hi) en el intervalo, la siguiente
(Propn Surviving) su complementario (1- hi) que estima la probabilidad de
que no ocurra el evento en el intervalo condicionada a que no ocurri antes; la
siguiente (Cumul Propn Surv at End) la funcin de supervivencia (Si), la
siguiente (Probability Densty) la funcin densidad de probabilidad (fi) por
unidad de tiempo. Se estima usando las relaciones entre las funciones vistas
anteriormente y dividiendo por la anchura del intervalo, es decir, si la anchura del
intervalo i fuera bi (en el ejemplo bi =5 en todos los intervalos)
La ltima columna (Hazard Rate) es la funcin de riesgo por unidad de

tiempo, estimada en el punto medio del intervalo por la frmula
Comparacin de funciones de supervivencia
Comparacin de funciones de
supervivencia
Como los estimadores de Kaplan-Meier son estimadores de mxima
verosimilitud y la teora establece que estos estimadores son asintticamente
normales, una primera aproximacin es usar dicha teora, es decir, si de una
poblacin con funcin de supervivencia S(t) se extraen dos muestras
independientes, y a partir de las mismas se calculan los estimadores
debido a su normalidad asinttica, las variables:
son, tambin asintticamente, normales de media 0 y varianza 1. Estas

variables se pueden usar para comparar para cada tiempo predeterminado, las
dos estimaciones. Sin embargo, generalmente, no interesa comparar para un
tiempo predeterminado (a veces s, por ejemplo para tiempos de corte muy
establecidos como supervivencia a los 5 aos para el cncer), sino comparar
globalmente ambas curvas de supervivencia.
Evidentemente, se podran comparar, por este procedimiento, punto a punto,
pero este modo de proceder es poco eficiente ya que no se usan todos los datos
en cada comparacin y aparecen los problemas asociados a las comparaciones
mltiples y, en consecuencia, se han desarrollado pruebas para realizar una
nica comparacin global. La ms popular es la conocida como prueba del logrank y puede verse como una aplicacin de la prueba de Mantel y Haenszel
para tablas de contingencia estratificadas y que se puede generalizar a la
comparacin de r funciones de supervivencia, con un estadstico que se
distribuye como una 2 con r - 1 grados de libertad.
Ejemplo 2
Comprense las funciones de supervivencia para los datos siguientes; donde,

como en el ejemplo anterior, las prdidas estn indicadas con asteriscos; extrados
de dos muestras hipotticas correspondientes a dos tratamientos distintos.
trat. A: 10, 13, 15*, 17, 19*, 20*
trat. B: 8, 10, 11, 11*, 12, 15*
Para hacerlo con el SPSS, se necesita crear un archivo con tres variables: tiempo,
estado (codificado, por ejemplo, 0: prdida, 1: muerte) y tratamiento (codificado,
por ejemplo, 0: tratamiento A, 1: tratamiento B).
y el resultado
Factor TRATA = A
Time
Cumulative
Status
Number
Events
Standard
Survival
Error
Remaining
10
muerte
1
13
2
15
2
17
3
19
3
20
3
Cumulative
,8333
,1521
,6667
,1925
,4444
,2222
5
muerte
4
prdida
3
muerte
2
prdida
1
prdida
0
Number of Cases:
Events: 3
Censored:
( 50,00%)
Survival Time
Standard Error
95% Confidence
Interval
Mean:
17
13;
20
9;
25
)
(Limited to
Median:
20 )
17

Factor TRATA = B
Time
Cumulative
Status
Number
Events
Cumulative
Standard
Survival
Error
Remaining
8
muerte
5
muerte
4
muerte
3
prdida
2
muerte
1
prdida
0
1
10
2
11
3
11
3
12
4
15
4
Number of Cases:
Events: 4
,8333
,1521
,6667
,1925
,5000
,2041
,2500
,2041
Survival Time
Censored:
Standard Error
( 33,33%)
95% Confidence
Interval
Mean:
12
10;
14
9;
13
)
(Limited to
Median:
15 )
11

Total
Number
Number
Percent
Events
Censored
Censored
TRATA
12
50,00
TRATA
B
2
Overall
5
33,33
41,67
Test Statistics for Equality of Survival Distributions for TRATA

Statistic
Log Rank
2,23
df
Significance
,1352
O con AlcEst para ver los intervalos de confianza
Ejemplo 3
Se quiere comparar la supervivencia a una cierta intervencin quirrgica en 3

hospitales distintos. Para ello se sigue en cada hospital a una muestra aleatoria de
pacientes intervenidos (habitualmente, y para aumentar el tamao muestral, se
sigue a todos los intervenidos, considerndolos entonces una muestra de todos los
potenciales enfermos) y se obtienen los siguientes tiempos, en meses:
Hosp A: 1, 3, 7, 8*, 12, 12, 15*
Hosp B: 2, 2, 3, 8, 10, 10, 12*, 15
Hosp C: 1, 1, 3, 7, 10*, 12, 12, 14, 15*
El resultado es:
Factor HOSPITAL = A
Time
Status
Cumulative
Cumulative
Number
Survival
Standard
Error
Events
Remaining
1
muerte
6
muerte
5
muerte
4
prdida
3
muerte
2
muerte
1
prdida
0
1
3
2
7
3
8
3
12
4
12
5
15
5
Number of Cases:
Events: 5
,8571
,1323
,7143
,1707
,5714
,1870
,1905
,1676
Survival Time
Censored:
Standard Error
( 28,57%)
95% Confidence
Interval
Mean:
5;
13
8;
16
)
(Limited to
Median:
15 )
12

Factor HOSPITAL = B
Time
Cumulative
Events
Status
Number
Cumulative
Standard
Survival
Error
Remaining
2
1
2
2
3
3
8
4
10
5
10
6
12
muerte
7
muerte
6
muerte
5
muerte
4
muerte
3
muerte
2
prdida
,7500
,1531
,6250
,1712
,5000
,1768
,2500
,1531
1
muerte
0
15
7
Number of Cases:
Events: 7
,0000
Survival Time
,0000
Censored:
Standard Error
( 12,50%)
95% Confidence
Interval
Mean:
4;
12
2;
14
)
Median:
)

Factor HOSPITAL = C
Time
Cumulative
Status
Number
Events
Cumulative
Standard
Survival
Error
Remaining
1
muerte
1
1
2
3
3
7
4
10
4
12
5
12
muerte
7
muerte
6
muerte
5
prdida
4
muerte
3
muerte
,7778
,1386
,6667
,1571
,5556
,1656
,2778
,1617
muerte
1
prdida
0
,1389
,1272
2
14
7
15
7
Number of Cases:
Events: 7
Survival Time
Censored:
Standard Error
( 22,22%)
95% Confidence
Interval
Mean:
5;
12
(Limited to
Median:
15 )
12
6;

Total
Number
Number
Percent
Events
Censored
Censored
HOSPITAL
2
24
19
28,57
HOSPITAL
B
12,50
HOSPITAL
2
C
22,22
Overall
5
20,83
Test Statistics for Equality of Survival Distributions for

HOSPITAL
Statistic
Log Rank
,41
df
Significance
,8164
18
Mtodos paramtricos de anlisis de supervivencia
Alternativa paramtrica
Una alternativa al mtodo de Kaplan-Meier para estimar funciones de
supervivencia y realizar contrastes de hiptesis sobre las mismas, consiste en
asumir ciertas funciones de probabilidad para la variable tiempo de espera. Si
esta asuncin es razonable, y para averiguarlo habr que realizar pruebas de
bondad del ajuste, estos mtodos paramtricos son ms poderosos que el de
Kaplan-Meier.
El mtodo consiste en estimar, por mxima verosimilitud, los parmetros
caractersticos de la funcin, y usar su normalidad asinttica para realizar la
estimacin por intervalos y los contrastes de hiptesis.
Las pruebas de bondad de ajuste se realizan con la habitual prueba basada en
la ji-cuadrado, con la del logaritmo del cociente de verosimilitudes (como en
regresin logstica) o con mtodos grficos.
La prueba basada en la ji-cuadrado se realiza distribuyendo el periodo de
observacin en k intervalos y calculando el estadstico:
siendo Oi los eventos observados en el intervalo i y Ei los esperados en la

hiptesis de que los datos provengan realmente de la distribucin considerada.
Este estadstico, como es sabido, se distribuye aproximadamente como una jicuadrado con k - r - 1 grados de libertad, siendo r el nmero de parmetros de la
distribucin estimados a partir de la muestra. Un nmero razonable para k es
. Esta prueba slo contempla los eventos, por lo tanto no tiene en cuenta la
informacin contenida en las prdidas.
Otro modo de contrastar la bondad del ajuste es usando el logaritmo del
cociente de verosimilitudes. Hay que tener en cuenta que en este contraste la
hiptesis nula es que el modelo no es adecuado, mientras que en el anterior es
que s lo es.
Un mtodo grfico complementario de observacin de la bondad del ajuste, es
dibujar la funcin de supervivencia estimada y, en la misma grfica, las
estimaciones puntuales no paramtricas obtenidas por el mtodo de KaplanMeier, o bien dibujar transformaciones de las funciones de supervivencia o
riesgo cuyas formas sean conocidas.
Las funciones que con ms frecuencia se usan se exponen en los apartados
siguientes.
Funcin exponencial
Funcin exponencial
La funcin exponencial est definida por:
Usando las relaciones entre las tres funciones las funciones de supervivencia y
riesgo para esta variable son
es decir, el riesgo es constante a lo largo del tiempo. A esta propiedad

caracterstica de la funcin exponencial se le suele llamar prdida de memoria, y
es la propiedad que permite evaluar grficamente si la funcin exponencial es
un modelo adecuado para unos datos.
Si un proceso es de Poisson (suceso raro y aleatorio en el tiempo), la variable
tiempo hasta que ocurra el primer suceso es exponencial, por esta razn esta
funcin es muy usada en control de calidad donde se puede asumir procesos
Poisson (p.e. la vida de los componentes electrnicos en un aparato, el tiempo
de espera en una consulta sin cita previa, o la vida de los vasos de vidrio en un
bar, siguen esta distribucin) y poco en Ciencias de la Salud, aunque se ha
usado, por ejemplo, para estudiar supervivencia a la arteritis(1).
Es til que sealar que, dentro de esta relacin entre las funciones exponencial
y de Poisson, el parmetro es la media de la variable de Poisson nmero de
sucesos en la unidad de tiempo.
El estimador del parmetro de la funcin y su varianza son
siendo d el nmero de eventos observados
Ejemplo 4
Calclese para los datos del ejemplo 1 la funcin de supervivencia estimada,
asumiendo un modelo exponencial, y realcese la prueba para la bondad del
ajuste.
Funcin exponencial
La salida de un paquete estadstico (PRESTA), eligiendo 4 intervalos para la

prueba de la bondad de ajuste es:
P R E S T A
PC
V2.2
19-OCT-2001
ANALISIS DE SUPERVIVENCIA
MODELO EXPONENCIAL : S(t)=exp(-At)
NOMBRE DE LOS DATOS:
VARIABLE TIEMPO:
VARIABLE PERDIDAS:
eje1sup
TIEMPO
PERDID
NUMERO DE CASOS:
12
CASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO
PARAMETRO
.06040
ERROR ESTANDAR
.02013
LOGARITMO DE MAXIMA VEROSIMILITUD SIN MODELO

LOGARITMO DE MAXIMA VEROSIMILITUD DEL MODELO
JI-CUADRADO:
34.43188
G.L.:
-17.044550
-34.260490
p= .000001
TABLA DE VALORES OBSERVADOS Y ESPERADOS

(SOLO CUENTAN LOS EVENTOS)
INTERVALO
<
4.76
4.76 - 11.48
11.48 - 22.95
> 22.95
OBSERVADOS
.00
4.00
5.00
.00
PRUEBA DE BONDAD DE AJUSTE

JI-CUADRADO:
7.66667
G.L.:
ESPERADOS
3.00
3.00
3.00
3.00
CONT. JI2
3.0000
.3333
1.3333
3.0000
p= .021258
Obsrvese la discrepancia entre ambas pruebas de bondad de ajuste, debido al

pequeo tamao muestral del ejemplo y al hecho de que hay 3 prdidas cuya
informacin no se usa en la ltima prueba.
Funcin exponencial
En la grfica se muestran las funciones de riesgo y supervivencia asumiendo el

modelo exponencial (lnea continua) y las estimaciones puntuales obtenidas por
el mtodo de Kaplan-Meier (aspas). Visualmente se observa que el modelo no
es satisfactorio: las estimaciones puntuales de la funcin de riesgo estn muy
alejadas de la recta horizontal que corresponde al modelo exponencial.
Ejemplo 5
Comprese, usando el modelo exponencial, las funciones de supervivencia
para los datos de la tabla, donde en la columna Perdida figura 0 para muerte y
1 para prdida, en Trata 1 y 2 para indicar dos tratamientos distintos y en
Tiempo el tiempo en meses. Adems figura la edad en aos al comienzo del
tratamiento, que se usar ms adelante.
La salida del PRESTA para este problema

P R E S T A
PC
V2.2
19-OCT-2001
MODELO EXPONENCIAL : S(t)=exp(-At)
VARIABLE TIEMPO:
VARIABLE PERDIDAS:
VARIABLE DEFINE GRUPOS:
GRUPO 1 Desde
GRUPO 2 Desde
NUMERO DE CASOS:
super5
TIEMPO
PERDID
TRATA
1.00 Hasta
2.00 Hasta
230
1.00
2.00
Funcin exponencial
GRUPO 1
PARAMETRO
.04826
ERROR ESTANDAR
.00464
LOGARITMO DE MAXIMA VEROSIMILITUD SIN MODELO -387.955200

LOGARITMO DE MAXIMA VEROSIMILITUD DEL MODELO -435.370300
JI-CUADRADO:
94.83020
G.L.: 42
p= .000006

INTERVALO
<
1.98
1.98 4.16
4.16 6.60
6.60 9.37
9.37 - 12.56
12.56 - 16.34
16.34 - 20.96
20.96 - 26.92
26.92 - 35.33
35.33 - 49.69
> 49.69
OBSERVADOS
5.00
17.00
10.00
9.00
13.00
7.00
10.00
8.00
11.00
9.00
9.00

JI-CUADRADO:
10.05983
G.L.:
ESPERADOS
10.64
10.64
10.64
10.64
10.64
10.64
10.64
10.64
10.64
10.64
10.64
CONT. JI2
2.9868
3.8073
.0381
.2517
.5253
1.2432
.0381
.6535
.0124
.2517
.2517
p= .345439
GRUPO 2
PARAMETRO
.08935
ERROR ESTANDAR
.00876

JI-CUADRADO:
55.42084
G.L.: 30
p= .003227

INTERVALO
<
1.07
1.07 2.25
OBSERVADOS
6.00
13.00
ESPERADOS
10.27
10.27
CONT. JI2
1.7772
.7241
Funcin exponencial
2.25
3.56
5.06
6.78
8.82
11.32
14.54
19.08
>
3.56
5.06
6.78
8.82
11.32
14.54
19.08
26.84
26.84
9.00
12.00
11.00
4.00
8.00
13.00
12.00
9.00
7.00

JI-CUADRADO:
9.54867
G.L.:
10.27
10.27
10.27
10.27
10.27
10.27
10.27
10.27
10.27
.1577
.2904
.0515
3.8302
.5028
.7241
.2904
.1577
1.0426
p= .388265
Ahora, con un tamao muestral mayor no hay discrepancia entre ambas pruebas
para la bondad del ajuste, las dos indican un buen ajuste. En la figura se presentan
las grficas (lneas continuas: estimaciones de las funciones usando el modelo
exponencial y aspas y cuadrados: el mtodo de Kaplan-Meier) y se observa que el
ajuste es muy satisfactorio.
Es decir, con ambos tratamientos el modelo exponencial es adecuado, o sea el

para el
riesgo se mantiene constante a lo largo del tiempo, siendo
tratamiento 1 y
para el 2, dicho de otro modo, con el tratamiento 1 se
producen en promedio 0,048 fallecimientos al mes y con el 2 se producen 0,089.
Para comparar las curvas se puede usar la diferencia de los parmetros
estimados como estadstico para el contraste, ya que su distribucin muestral es
asintticamente normal con media 0 y varianza la suma de varianzas. En este
caso:
Funcin exponencial
que comparndolo con el valor crtico z0,025= 1,96 permite rechazar la hiptesis
nula de igualdad.
Referencias
1
M.A.Gonzlez-Gay, R.Blanco, V.Abraira, C.Garca-Porra, D.Ibez,
M.T.Rigueiro, A.Snchez-Andrade, J.Guerrero, E.Casariego. Giant cell arteritis in Lugo,
Spain, is associated with low longterm mortality. Journal of Reumathology. 24: 21712176. (1997).
Funcin de Weibull
Funcin de Weibull
La funcin de Weibull est definida por:
Obsrvese que para =1 esta funcin es la exponencial, es decir la funcin

exponencial es una particularizacin de la funcin ms general de Weibull.
Usando las relaciones entre las tres funciones las funciones de supervivencia y
riesgo para esta variable son
es decir, el riesgo es creciente a lo largo del tiempo para > 1 (por ejemplo,
supervivencia de pacientes con una enfermedad crnica sin respuesta al
tratamiento, o materiales con fatiga), constante para = 1 (materiales sin fatiga)
y decreciente para < 1 (enfermos con ciruga mayor practicada con xito).
Ntese que calculando dos veces el logaritmo de la funcin de supervivencia
y calculando el logaritmo de la funcin de riesgo
es decir las relaciones entre el logaritmo del logaritmo cambiado de signo de la

supervivencia con el logaritmo del tiempo (primera frmula) y el logaritmo del
riesgo con el logaritmo del tiempo (segunda frmula) son lineales. A veces se
usan estas relaciones para evaluar la idoneidad del modelo de Weibull.
Se ha usado esta funcin para estudiar supervivencia a las bacteriemias y al
cncer gstrico (1).
Ejemplo 6
Ajstese, con las pruebas de bondad de ajuste, la funcin de Weibull a los datos
de la tabla, donde en la columna Perdida figura 0 para muerte y 1 para prdida
y en Tiempo el tiempo en meses.
La grafica de ln[-ln(S(t))] en funcin de lnt para evaluar la idoneidad del modelo

Funcin de Weibull
(en un modelo Weibull debe ser una lnea recta).
La salida del PRESTA para este problema (ntese que se denomina parmetro A
a y parmetro B a
P R E S T A
PC
V2.2
25-OCT-2001
MODELO WEIBULL : S(t)=exp[-(At)**B]

VARIABLE TIEMPO:
VARIABLE PERDIDAS:
NUMERO DE CASOS:
super6
TIEMPO
PERDID
161
A
B
PARAMETRO
.01778
2.37622
ERROR ESTANDAR
.00068
.17212
A
B
Funcin de Weibull
A
B
.00000
-.00001
-.00001
.02963

JI-CUADRADO:
107.24410
G.L.: 59
p= .000130

INTERVALO
< 21.82
21.82 - 29.92
29.92 - 36.45
36.45 - 42.40
42.40 - 48.21
48.21 - 54.22
54.22 - 60.82
60.82 - 68.73
68.73 - 79.91
> 79.91
OBSERVADOS
20.00
8.00
10.00
13.00
17.00
20.00
5.00
14.00
10.00
5.00

JI-CUADRADO:
26.81367
G.L.:
ESPERADOS
16.10
16.10
16.10
16.10
16.10
16.10
16.10
16.10
16.10
16.10
CONT. JI2
.9447
4.0752
2.3112
.5969
.0503
.9447
7.6528
.2739
2.3112
7.6528
p= .000408
Vuelve a aparecer, como en el ejemplo 4, discrepancias entre ambas pruebas

de bondad de ajuste, debido a que en la ltima no se usan las prdidas. En
estos casos resulta til recurrir a las pruebas grficas. Tanto en la grfica
logartmica como en la comparacin de la funcin de supervivencia con las
estimaciones puntuales que se presenta a continuacin el modelo parece
adecuado.
Funcin de Weibull
Un contraste que tambin interesa hacer es s el modelo exponencial es

adecuado, es decir si =1 contra la hiptesis alternativa >1. Se hace con el
estadstico
que en este ejemplo es
nula de modelo exponencial.
Referencias
1
Marubini E, Bonfanti G, Bozzetti F, et al. A prognostic score for patients resected for gastric
cancer. Eur J Cancer 29A: 845-850. (1993).
Funcin lognormal
Funcin lognormal
La variable T sigue una distribucin lognormal si lnT tiene una distribucin
normal de media y varianza . En consecuencia, la variable
es un variable normal reducida, es decir de media igual a 0 y desviacin tpica

igual a 1. Por lo tanto, la funcin de supervivencia se puede escribir
siendo
la funcin de distribucin acumulativa de la normal reducida. Por lo
tanto un modo grfico de verificar esta distribucin es comparar la funcin de
supervivencia dibujada en papel lognormal con una recta.
La funcin estn caracterizadas por los dos parmetros y , que no son su
media y desviacin tpica. La estimacin de estos parmetros slo es sencilla en
el caso de que no haya prdidas y sta es la que implementa el PRESTA.
Se ha usado esta funcin para estudiar tanto la supervivencia en SIDA (1), como
el tiempo hasta la seroconversin de HIV+ (2).
Ejemplo 7
Estmese las funcin de supervivencia, asumiendo el modelo lognormal y
realcese la prueba de la bondad de ajuste, para los datos de la tabla.
La salida del PRESTA es (ntese que se denomina parmetro A a y parmetro

B a 2)
P R E S T A
PC
V2.2
MODELO LOG-NORMAL : f(lnt)=N(A,B)
26-OCT-2001
Funcin lognormal
super72
VARIABLE TIEMPO:
TIEMPO
VARIABLE PERDIDAS NO SE USA
NUMERO DE CASOS:
121
PARAMETRO
ERROR ESTANDAR
2.32263
.04138
.20719
.02664
A
.00171
.00000
.00000
.00071

INTERVALO
OBSERVADOS
<
10.00
5.69
ESPERADOS
12.10
CONT. JI2
.3645
Funcin lognormal
5.69 -
6.96
9.00
12.10
.7942
6.96 -
8.04
18.00
12.10
2.8769
8.04 -
9.09
12.00
12.10
.0008
9.09 -
10.20
17.00
12.10
1.9843
10.20 -
11.45
12.00
12.10
.0008
11.45 -
12.95
8.00
12.10
1.3893
12.95 -
14.96
9.00
12.10
.7942
14.96 -
18.28
16.00
12.10
1.2570
>
18.28
10.00
12.10
.3645

JI-CUADRADO:
9.82645
G.L.:
p= .197686
Con la prueba de bondad de ajuste basada en la ji-cuadrado, que en este caso que
no hay prdidas funciona mejor, no se rechaza la hiptesis nula de modelo
lognormal y en la grfica tambin se observa que el modelo es satisfactorio.
Funcin lognormal
Aceptando que el modelo es bueno, calclese la supervivencia a 8 aos

(suponiendo los tiempos en aos) y la mediana de supervivencia.
En la grfica se observa que para T=8, S(t) es aproximadamente 0,7 y que
S(t)=0,5 para t=10 aproximadamente. O bien, ms laborioso pero ms preciso,
usando las frmulas
y mirando en la tabla de la normal
es decir la probabilidad de supervivencia a los 8 aos es 0,7019. La mediana es

el tiempo en el que S(t)=0,5
y mirando en la tabla de la normal
Referencias
1
Veugelers PJ, Cornelisse PG, Craib KJ, et al. Models of survival in HIV infection and their
use in the quantification of treatment benefits. Am J Epidemiol 148: 487-496. (1998).
Funcin lognormal
2
Muoz A, Xu J. Models for the incubation of AIDS and variations according to age and
period. Stat Med. 30: 2459-2473. (1996).
Funcin gamma
Funcin gamma
El modelo gamma est definido por la funcin de probabilidad
siendo () la funcin gamma, definida como:
Como (1) = 1, la funcin de probabilidad gamma cuando = 1 es la

exponencial. Otro caso particular de esta funcin es = 1/2 y = r/2, siendo r un
nmero natural, que recibe el nombre de ji-cuadrado con r grados de libertad.
Del mismo modo que la variable tiempo hasta que ocurra el primer evento de
un proceso es de Poisson es exponencial, la variable tiempo hasta que ocurra el
evento k-simo es gamma con = k
La estimacin de esta funcin slo es sencilla en el caso de que no haya
prdidas y sta es la que implementa el PRESTA.
Ejemplo 8
Estmese la funcin de supervivencia, asumiendo el modelo gamma, y realcese la
prueba de la bondad de ajuste, para los datos de la tabla.
La salida del PRESTA es (ntese que se denomina parmetro A a y parmetro

B a )
P R E S T A
PC
V2.2
MODELO GAMMA : S(t)=1-I(A,Bt)*(Bt)**A/G(A)

super8
VARIABLE TIEMPO:
TIEMPO
VARIABLE PERDIDAS NO SE USA
NUMERO DE CASOS:
95
27-OCT-2001
Funcin gamma
A
B
PARAMETRO
7.81341
.08169
ERROR ESTANDAR
.85924
.00947
A
B
A
.73829
.00772
B
.00772
.00009
JI-CUADRADO:
143.23240
G.L.: 64
p= .000000

INTERVALO
< 17.80
17.80 - 35.60
35.60 - 53.40
53.40 - 71.20
71.20 - 89.00
89.00 - 106.80
106.80 - 124.60
124.60 - 142.40
142.40 - 160.20
> 160.20
OBSERVADOS
.00
1.00
6.00
17.00
19.00
17.00
19.00
8.00
5.00
3.00

JI-CUADRADO:
2.96491
G.L.:
ESPERADOS
.02
1.15
7.07
15.81
20.45
18.87
13.86
8.65
4.77
4.36
CONT. JI2
.0182
.0205
.1621
.0901
.1023
.1846
1.9044
.0485
.0110
.4233
p= .888640
Con ambas pruebas de bondad de ajuste se acepta el modelo gamma y en la

grfica tambin se observa que el modelo es satisfactorio.
Funcin gamma
Igual que con el modelo de Weibull, un contraste que tambin interesa hacer es
s el modelo exponencial es adecuado, es decir si =1 contra la hiptesis
alternativa >1. Se hace con el estadstico
que en este ejemplo es
nula de modelo exponencial.
Modelo de riesgo proporcional (Cox)
Hasta aqu se han estudiado mtodos que permiten estimar las funciones de riesgo
y supervivencia para una muestra aleatoria y comparar dos o ms estimaciones.
El objetivo ahora es plantear un modelo de regresin para el riesgo, o la
supervivencia, en funcin de variables "explicatorias", que permita comparar
dichas estimaciones, teniendo en cuenta el efecto de otras variables distintas de la
que se utiliza para definir los grupos.
Por ejemplo, la supervivencia a dos tratamientos alternativos puede depender
no slo del tratamiento, sino tambin de otras variables como la edad, el sexo, o
la gravedad de la afeccin de cada paciente. En los mtodos previos se asume
que el muestreo aleatorio hace que los distintos grupos sean homogneos con
respecto a todas las dems variables, sin embargo no siempre es as (el
muestreo aleatorio slo garantiza que las muestras homogneas sean las ms
probables) y, por otro lado, a veces interesa estimar la supervivencia para
distintos valores de las otras variables. Los modelos de regresin permiten
hacer ambas cosas.
Hay varios modelos de regresin propuestos, como el llamado modelo
acelerado en que se asume que la funcin de supervivencia es una funcin del
tiempo y de otras k variables (representadas por el vector, de dimensin k, X) de
la siguiente forma:
siendo (X,) una funcin de X con unos coeficientes , que seran los
coeficientes a estimar para el modelo.
Otros modelos asumen algunas de las funciones de supervivencia vistas antes
planteando el modelo de regresin para los parmetros de las funciones.
Sin embargo, el modelo ms popular, por su sencillez y facilidad para interpretar
los coeficientes , es el denominado modelo de riesgo proporcional o modelo de
Cox que es un modelo de la forma
Es decir, h0(t) es el riesgo cuando todas las variables Xi son 0, o riesgo basal,
que es variable con el tiempo.
Otra manera equivalente de expresarlo es:
es decir, el modelo plantea el logaritmo del riesgo relativo como una funcin
lineal de las variables independientes. Se supone, por lo tanto, que el riesgo

relativo, a diferencia del riesgo propiamente dicho, no depende del tiempo o,
dicho de otra manera, que es constante a lo largo del tiempo (de ah el nombre
de modelo de riesgo proporcional).
La forma anterior hace explcita la interpretacin de los coeficientes: i es el
logaritmo del riesgo relativo cuando Xi aumenta una unidad, mantenindose
constantes las dems variables, y por tanto, exp(i) es el riesgo relativo cuando
Xi aumenta una unidad, mantenindose constantes las dems.
Ntese que el modelo no depende de cmo sea h0(t), podra ser de cualquiera
de las formas vistas antes u otras, la nica asuncin es que el riesgo relativo al
aumentar una unidad cada variable es constante (exp(i)) en todo tiempo. Hay
que destacar que esta asuncin no siempre es razonable y conviene evaluarla
en cada caso, por ejemplo, con grficas que representen el logaritmo de los
riesgos para distintos valores de las variables Xi en funcin del tiempo, cuando
el riesgo es proporcional deben ser paralelas.
Estimacin y contrastes en el modelo de Cox
Estimacin de los coeficientes y

contrastes de hiptesis
Para estimar los coeficientes por el mtodo de mxima verosimilitud es
necesario construir la funcin de verosimilitud. Para ello hay varios mtodos,
pero el primero histricamente y el ms general es el debido a Cox y se basa en
la funcin de verosimilitud parcial: y parte de que dado que el modelo no hace
ninguna asuncin sobre h0(t), la nica contribucin de los datos a la
verosimilitud es en los tiempos en que se observan eventos.
Los clculos necesarios para la estimacin son muy largos, sobre todo cuando
para algn tiempo hay ms de un evento. Los paquetes estadsticos suelen usar
una aproximacin (aproximacin de Peto) que es buena cuando, para cada
tiempo, el nmero de eventos es pequeo comparado con los individuos en
riesgo.
Teniendo en cuenta que los estimadores lo son por mxima verosimilitud, los
contrastes de hiptesis sobre cada coeficiente se hacen usando su normalidad
asinttica (prueba de Wald) y los contrastes de hiptesis sobre el modelo
completo o sobre un conjunto de coeficientes con el logaritmo del cociente de
verosimilitudes (exactamente igual que en regresin logstica).
Es decir y resumiendo un poco, un intervalo de confianza al (1- )% para el

coeficiente i es:
En regresin de Cox los estimadores de la asociacin no son los coeficientes i

sino los riesgos relativos, por lo tanto los intervalos de confianza que interesan
calcular son los de los riesgos relativos. Dichos intervalos estn dados por:
El estadstico para el contraste:

H0: i = a
H1: i a siendo a una constante, es:
Estimacin y contrastes en el modelo de Cox
y la regin crtica: |z| > z/2

o equivalentemente:
que se distribuye como una ji-cuadrado con 1 grado de libertad y, por tanto, la
regin crtica para el contraste es
contrastes de Wald.
. A estos contrastes se les denominan
Un contraste que interesa realizar es 1=0; el que no se pueda rechazar esta

hiptesis indica que el riesgo no depende de la variable X.
Estrategias de modelizacin con el modelo de Cox
Las estrategias de modelizacin son exactamente las mismas que las utilizadas en los otros modelos de regresin,
contrastndose tambin del mismo modo la interaccin y la confusin y pudindose usar tambin las variables
dummy.
Ejemplo 9
Comparar la supervivencia de los tratamientos del ejemplo 5 controlando los posibles efectos de confusin e
interaccin de la edad.
En el ejemplo 5 se encontr que la supervivencia con ambos tratamientos ajustaba a un modelo exponencial, es
decir con ambos tratamientos el riesgo es constante (por lo tanto se cumple la asuncin de riesgo proporcional):
0,048 para el tratamiento 1 y 0,089 para el tratamiento 2, siendo ambos riesgos significativamente distintos.
Analizado con la regresin de Cox univariante
Se encuentra un resultado prcticamente superponible: hay una diferencia estadsticamente significativa

(p=0.000) y el riesgo relativo es 1,892.
Sin embargo la edad media en ambos grupos es muy distinta (39,8 en los pacientes que reciben el tratamiento 1
y 64,7 en los que reciben el tratamiento 2) por lo tanto podra ser una variable de confusin.
Realizando un anlisis multivariante, incluyendo en el modelo mximo: tratamiento, edad y el producto
tratamiento por edad para evaluar la interaccin y usando la estrategia hacia atrs
El modelo globalmente es significativo, evaluado con la prueba del logaritmo del cociente de verosimilitudes, que
el SPSS denomina prueba mnibus. El coeficiente del termino de interaccin no es distinto de 0 (p=0,931) por
lo tanto no se rechaza la hiptesis nula de no existencia de interaccin y se elimina esa variable
Obsrvese que la variable EDAD es una variable de confusin: el riesgo relativo ha disminuido desde 1,892
estimado con el modelo simple a 1,449, Adems ha dejado de ser significativo.
En consecuencia este sera el modelo final y la conclusin del anlisis es que, una vez controlado por la edad,
no hay diferencia significativa entre ambos tratamientos.
Estrategias de modelizacin con el modelo de Cox
Medidas de frecuencia de la enfermedad. Introduccin
MEDIDAS DE FRECUENCIA DE LA ENFERMEDAD

V. Abraira
Bibliografa:
D.G.Kleinbaum, L.L.Kupper, H.Morgenstern
Epidemiologic Research. Principles and Cuantitative Methods
Van Nostrand Reinhold Company. 1982
Introduccin
La caracterstica definitoria de la Epidemiologa como ciencia es la
cuantificacin. Por ejemplo Rothman dice que la Epidemiologa no es otra cosa
que un ejercicio de medicin y Anderson que es el estudio de la ocurrencia de
los procesos patolgicos. Por ello, ha desarrollado instrumentos para:
Medir la frecuencia de la enfermedad
Medirla en relacin con sus supuestos determinantes
La epidemiologa clnica aplica el mtodo epidemiolgico para producir
conocimiento sobre el proceso de la prctica clnica; aplica por tanto los mismos
instrumentos para medir la frecuencia no slo de la enfermedad sino tambin de
otros eventos que ocurren en la prctica clnica: curar, solicitar una prueba
diagnstica, aplicar un tratamiento. Esto provoca a veces, alguna confusin
terminolgica de la que probablemente no estn exentos estos apuntes en los
que se trata de estudiar
las medidas de frecuencia de un evento (en epidemiologa suele ser
enfermar, pero en epidemiologa clnica tambin curacin, muerte, etc.)
las medidas de asociacin entre eventos (factores de riesgo, factores
pronsticos, tratamientos, etc. con enfermar, curar, morir, etc.) y
las llamadas medidas de impacto
Otras lecturas
F.Pozo, J.R.Ricoy, P.Lzaro. Una estrategia de investigacin en el Sistema
Nacional de Salud: I. La epidemiologa clnica. Medicina Clnica 1994; 102:664669.
http://www.hrc.es/bioest/Medidas_frecuencia_1.html [02/01/2003 02:15:54]
Prevalencia
Prevalencia
Es la proporcin de individuos de una poblacin que presentan el evento en un
momento, o periodo de tiempo, determinado. Por ejemplo la prevalencia de
diabetes en Madrid en el ao 2001 es la proporcin de individuos de esa
provincia que en el ao 2001 padecan la enfermedad. Se calcula
Caractersticas
Es una proporcin:
no tiene dimensiones
su valor oscila entre 0 y 1, aunque a veces se expresa como
porcentaje
Es un indicador esttico, que se refiere a un momento temporal
Indica la carga del evento que soporta la poblacin, tiene su mayor
utilidad en los estudios de planificacin de servicios sanitarios
En la prevalencia influye la velocidad de aparicin del evento y su
duracin; es por ello poco til en la investigacin causal y de medidas
teraputicas
Incidencia
Incidencia
La incidencia refleja el nmero de nuevos casos en un periodo de tiempo. Es
un ndice dinmico que requiere seguimiento en el tiempo de la poblacin de
inters. Cuando la enfermedad es recurrente se suele referir a la primera
aparicin.
Se puede medir con dos ndices: incidencia acumulada y densidad (o tasa) de
incidencia.
Incidencia acumulada
Es la proporcin de individuos que desarrollan el evento durante el periodo de
seguimiento. Se calcula
Caractersticas
Es una proporcin
no tiene dimensiones.
su valor oscila entre 0 y 1, aunque tambin se suele expresar como
porcentaje
Depende del tiempo de seguimiento
Se calcula sobre una cohorte fija, es decir no se permiten entradas de
nuevos individuos durante el seguimiento.
La principal limitacin de este ndice proviene del efecto de cohorte fija, puesto
que a lo largo del seguimiento generalmente se pierden individuos.
Ejemplo 1:
Se sigue durante 12 meses a un grupo de 6 individuos que han sufrido un
accidente cerebro-vascular (ACV), para evaluar la incidencia de recidiva. La
situacin se puede esquematizar en la figura
http://www.hrc.es/bioest/Medidas_frecuencia_3.html (1 of 2) [02/01/2003 02:16:41]
Incidencia
Los rombos rojos sealan recidivas mientras que los crculos verdes sealan
prdidas: el paciente B desapareci del estudio a los 2,5 meses, sin que hasta
ese momento hubiera sufrido una recidiva, el paciente D falleci por otra causa
no relacionada con el ACV, los pacientes C y F acabaron el periodo de estudio
sin recidiva.
La IA en los 2 aos de seguimiento es 2/6
Obsrvese la indeterminacin de este ndice debido a las prdidas; en este
ejemplo si se hubiera completado el periodo de observacin en todos los
individuos, B y D podran haber tenido un nuevo ACV y la IA sera distinta.
Densidad de incidencia
Densidad (o tasa) de incidencia

Para evitar la limitacin de la incidencia acumulada se define este otro ndice de
incidencia:
La densidad, o tasa, de incidencia es el cociente entre el nmero de casos nuevos

ocurridos durante el periodo de seguimiento y la suma de todos los tiempos de
observacin. Se calcula
Caractersticas:
Tiene dimensin de inversa del tiempo.

Rango ilimitado.
No depende del tiempo de seguimiento, asumiendo estacionareidad, es
decir ritmo constante.
No necesita cohorte fija.
Ejemplo 2
Supngase para el ejemplo 1, el esquema de seguimiento de la figura:
Es decir, es una cohorte dinmica en la que se permite incorporaciones, por

tanto el seguimiento no empez al mismo tiempo para todos los individuos.
Como en el ejemplo 1, los rombos rojos sealan recidivas mientras que los
crculos verdes sealan prdidas: el seguimiento de los pacientes D, E y F
comenz 1, 2 y 6 meses despus de empezado el estudio, el paciente B
Densidad de incidencia
desapareci del estudio a los 2,5 meses, sin que hasta ese momento hubiera
sufrido una recidiva, el D falleci por otra causa no relacionada con el ACV, los
pacientes C y F acabaron el periodo de estudio sin recidiva.
La suma de los tiempos de observacin es
y, por tanto, la densidad de incidencia
Intervalos de confianza de los ndices de prevalencia e incidencia
Intervalos de confianza de los ndices de prevalencia e incidencia

La prevalencia y la incidencia acumulada son proporciones, por tanto sus IC se
calculan como tales, es decir
Ejemplo 3:
En una muestra aleatoria de 500 personas de un rea, hay 5 diabticos. La
prevalencia estimada es
y su intervalo de confianza al 95%:
Para construir el intervalo de confianza de la densidad de incidencia hay que

tener en cuenta que el numerador es una variable de Poisson cuya varianza es
igual a su media, asumiendo que el denominador es constante, una manera
aproximada de calcular el intervalo es:
siendo d el nmero de eventos y L la suma de los tiempos. El IC para el ejemplo

2 se calcula:
Ntese el valor negativo del lmite inferior que indica que para los datos de este
ejemplo la aproximacin es mala.
Medidas de asociacin o efecto
Medidas de asociacin o efecto

Son medidas que se usan para evaluar la asociacin entre un evento y un factor
de estudio, por ejemplo: mutacin de un gen (factor) y una enfermedad (evento);
tratamiento (factor) y curacin (evento). La mayora de ellas ya han sido
estudiadas en otra parte de estos apuntes y sern repasadas ahora. Comparan
medidas de frecuencia del evento entre dos o ms grupos, definidos por
diferentes categoras del factor. En aras de la simplicidad, consideraremos slo
2 grupos, uno de ellos, usado como referencia, no tiene el factor y el otro s. La
categora de referencia debera tener un tamao grande para obtener
estimaciones precisas y ser suficientemente homognea para facilitar la
interpretacin.
Comparar dos medidas de frecuencia se puede hacer con su cociente (si no son
distintas se obtiene 1) o con la diferencia (si no son distintas se obtiene 0)
Las medidas basadas en el cociente, llamadas medidas de efecto, son:
Razn de tasas de incidencia
Riesgo relativo (cociente de prevalencias o cociente de incidencias
acumuladas)
Odds ratio
Las medidas basadas en la diferencia, llamadas medidas de impacto, son:
Diferencia absoluta (o exceso) de riesgo
Diferencia relativa de riesgo (o fraccin atribuible)
Reduccin absoluta de riesgo
Reduccin relativa de riesgo
Nmero necesario a tratar

Jaeschke et al Assessing the effects of treatment: measures of association.
CMAJ. 152:351-357. 1995
Abraira Medidas del efecto de un tratamiento (I): reduccin absoluta del riesgo,
reduccin relativa del riesgo y riesgo relativo. SEMERGEN 26: 535-536. 2000.
Abraira Medidas del efecto de un tratamiento (II): odds ratio y numero necesario
para tratar. SEMERGEN 27: 418-420. 2001.

Tambin llamada razn de densidades de incidencia (RDI), es el cociente entre
las tasas de incidencia de ambos grupos, poniendo en el denominador la del
grupo de referencia.
En la tabla se representan esquemticamente los resultados de un estudio que

permita evaluar la RDI, en la columna nF figuran los eventos (d0) y las personastiempo (L0) en la categora que no tiene el factor y en la columna F los de la
categora que s tiene el factor
Eventos
Personastiempo
nF
d0
L0
F
d1
L1
Total
d
L
A partir de la tabla
Caractersticas
rango de 0 a .
RDI=1 si no hay asociacin entre la presencia del factor y el evento.
RDI>1 si la asociacin es positiva, es decir si la presencia del factor se
asocia a mayor ocurrencia del evento y RDI <1 si la asociacin es negativa.
Ejemplo 4:
En un ensayo clnico para evaluar el efecto del tratamiento con un IECA ms un
diurtico opcional, en pacientes que haban sufrido un ACV, se estudi como
evento la ocurrencia de otro ACV en los siguientes 4 aos, los resultados fueron:
Placebo Tratamiento Total
ACV
420
307
727
Personas-ao 11889
11983
23872
A partir de aqu:
que indica que en los pacientes tratados con el tratamiento experimental la tasa
de incidencia de otro ACV es el 73% de la de los pacientes tratados con
placebo.
Referencia
PROGRESS Collaborative Group. Randomised trial of a perindopril-based bloodpressure-lowering regimen among 6105 individuals with previous stroke or
transient ischaemic attack. Lancet 2001; 358:1033-1041.
Riesgo relativo
Riesgo relativo
En epidemiologa se denomina riesgo a la probabilidad de ocurrencia de un
evento, tpicamente enfermar, aunque tambin morir, curar, etc.(en la
terminologa anglosajona se usan los trminos risk y hazard, este ltimo
especialmente si el evento es morir). Ms precisamente (vase el cap 6 de
Kleinbaum et al. para ms detalles) se define el riesgo como la probabilidad de
que un individuo, libre de enfermedad y susceptible de ella, la desarrolle en un
periodo determinado, condicionada a que el individuo no muera a causa de otra
enfermedad durante el periodo.
La incidencia acumulada es un estimador de esta definicin de riesgo, mientras
que la prevalencia es un estimador de otra posible definicin de riesgo:
probabilidad de que un individuo de una determinada poblacin tenga una
enfermedad en un momento o periodo de tiempo determinado.
En ambos casos se usa el cociente entre el riesgo en el grupo con el factor y el
riesgo en el grupo de referencia como ndice de asociacin y se denomina
riesgo relativo (RR).
En la tabla se representan esquemticamente los resultados de un estudio que
permita evaluar el RR, en la columna nF figuran los eventos (casos: a0) y los
no casos (b0) en la categora que no tiene el factor y en la columna F los de la
categora que s tiene el factor
Casos
nF
a0
F
a1
No casos
Total
b0
n0
b1
n1
Caractersticas
rango de 0 a .
RR=1 si no hay asociacin entre la presencia del factor y el evento.
RR>1 si la asociacin es positiva, es decir si la presencia del factor se
asocia a mayor ocurrencia del evento y RR<1 si la asociacin es negativa.
Ejemplo 5:
Riesgo relativo
Otra forma de resumir los resultados del ensayo clnico del ejemplo 4 es:
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
Y a partir de la tabla:
Odds ratio
Odds ratio
Existe otra manera, proveniente del mundo del juego, de representar la
probabilidad de ocurrencia de un evento y es mediante el cociente entre la
probabilidad de que ocurra el evento y la probabilidad de que no ocurra. Este
cociente, que en ingls se denomina odds y para el que no hay una traduccin
espaola comnmente aceptada, indica cuanto ms probable es la ocurrencia
del evento que su no ocurrencia.
El odds ratio (OR) es el cociente entre el odds en el grupo con el factor y el odds
en el grupo sin el factor. A partir de la tabla en la que en la columna nF figuran
los eventos (casos: a0) y los no casos (b0) en la categora que no tiene el
factor y en la columna F los de la categora que s tiene el factor
Casos
nF
a0
F
a1
No casos
Total
b0
n0
b1
n1
El OR se calcula
Caractersticas
rango de 0 a .
OR=1 si no hay asociacin entre la presencia del factor y el evento.
OR>1 si la asociacin es positiva, es decir si la presencia del factor se
asocia a mayor ocurrencia del evento y OR<1 si la asociacin es negativa.
Relaciones entre el OR y el RR
RR ms intuitivo.
OR se puede estimar siempre y de la misma forma; el RR no se puede
en los diseos casos control.
El OR permite, mediante la regresin logstica, ajustar por variables de
confusin.
Odds ratio
El OR est siempre ms alejado de 1 que el RR.

Si el riesgo es bajo, son muy parecidos.
Ejemplo 6:
Para la tabla del ejemplo 5:
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
El OR se calcula:
Obsrvese que es ms distinto de 1 que el RR.
Diferencia absoluta de riesgo

Tambin llamada exceso de riesgo, se calcula como la diferencia entre el riesgo
en el grupo con el factor y el riesgo en el grupo control.
Casos
nF
a0
F
a1
No casos
Total
b0
n0
b1
n1
La DAR se calcula
Caractersticas
rango de 1 a 1.
DAR=0 si no hay asociacin entre la presencia del factor y el evento.
DAR>0 si la asociacin es positiva, es decir si la presencia del factor se
asocia a mayor ocurrencia del evento y DAR<0 si la asociacin es negativa.
Ejemplo 7:
Para los datos del ejemplo 5:
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
La DAR es:
como es negativo indica que el riesgo en el grupo tratado es menor que en el

grupo placebo; por cada 100 pacientes tratados se producen 3,7 ACV menos
respecto a los que se produciran si no se trataran.
En general, se suele usar este ndice cuando el riesgo en el grupo expuesto es
mayor que en el grupo control, es decir cuando la DAR es positiva, en caso
contrario (como en el ejemplo) se usa la reduccin absoluta de riesgo.

Se calcula como la diferencia entre el riesgo en el grupo control y el riesgo en el
grupo con el factor; es, por tanto igual a la diferencia absoluta de riesgo
cambiada de signo.
Casos
nF
a0
F
a1
No casos
Total
b0
n0
b1
n1
La RAR se calcula
Caractersticas
rango de 1 a 1.
RAR=0 si no hay asociacin entre la presencia del factor y el evento.
RAR<0 si la asociacin es positiva, es decir si la presencia del factor se
asocia a mayor ocurrencia del evento y RAR>0 si la asociacin es negativa.
Ejemplo 8:
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
La RAR es:
que, similarmente a la diferencia absoluta de riesgo, se interpreta como que por

cada 100 pacientes tratados se producen 3,7 ACV menos respecto a los que se
produciran si no se trataran.
Diferencia relativa de riesgo

Tambin llamada fraccin atribuible, se calcula como el cociente entre la
diferencia absoluta de riesgo y el riesgo en el grupo control.
Casos
nF
a0
F
a1
No casos
Total
b0
n0
b1
n1
La DRR se calcula
Reduccin relativa de riesgo

De modo similar se define, y se suele usar cuando el riesgo en el grupo
expuesto (con el factor) es menor que el riego del grupo control, la reduccin
relativa del riesgo como el cociente entre la reduccin absoluta de riesgo y el
riesgo en el grupo control.
Ejemplo 9:
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
La DRR es:
y la RRR
que indica que el riesgo del grupo tratado se reduce un 26,8% del riesgo del
grupo control.

Es el ndice ms reciente y fue propuesto en el contexto de los ensayos clnicos
para evaluar el impacto del un tratamiento. Cobra, por tanto, todo su sentido
cuando el factor a estudio es un tratamiento. Se define como el nmero de
individuos que hay que tratar con el tratamiento experimental para producir, o
evitar, un evento adicional respecto a los que se produciran con el tratamiento
control. Se calcula como el inverso de la RAR
Casos
nF
a0
F
a1
No casos
Total
b0
n0
b1
n1
El NNT se calcula como
La relaccin entre la RAR y el NNT, puede entenderse mediante una simple

regla de tres: puesto que la RAR, multiplicada por 100 para expresarla como
porcentaje, se interpreta como que por cada 100 pacientes tratados se producen
RAR eventos menos, para producir 1 menos necesitamos tratar 100/(RARx100)
= 1/RAR
Ejemplo 10:
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
El NNT es:
y significa que por cada 27 pacientes tratados con el tratamiento experimental

se evitara 1 recurrencia de ACV.
Comparacin de los distintos ndices

Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
Hemos encontrado los siguientes ndices:

RR=0,73
OR=0,70
NNT=27
RAR=3,7%
RRR=26,8%
Todos ellos calculados con la misma tabla, por lo tanto todos ellos expresan
exactamente el mismo efecto. Hay que notar, sin embargo que las relaciones
entre ellos no se mantienen entre diferentes estudios (es decir, por ejemplo no
siempre un RR=0,73 es equivalente a un OR=0,70 ni a un NNT=27, aunque
siempre RAR=3,7% es equivalente a NNT=27). Existe evidencia emprica1,2 de
que el efecto apreciado por los lectores de la investigacin mdica depende en
gran medida del ndice usado, por lo tanto conviene familiarizarse con ellos y
sus relaciones.
De la experiencia de cientos de meta-anlisis se desprende que los ndices
relativos (RR y OR) tienden a ser ms parecidos entre diferentes ensayos del
mismo tratamiento que los ndices absolutos (RAR y NNT), o dicho de otra
manera los ndices relativos seran caractersticos del tratamiento, mientras que
los absolutos dependeran del tratamiento y tambin del riesgo del grupo control.
Para decidir si el resultado de un estudio, expresado con un ndice absoluto
como el NNT, es aplicable en nuestro medio, hay que evaluar si el riesgo basal
del estudio se similar al de nuestro medio y en caso contrario adaptar el ndice a
nuestro riesgo basal. Igualmente, en un metanlisis, el clculo de un NNT global
puede ser poco informativo si en los ensayos individuales hay heterogeneidad
en los riesgos basales.
1. Meneu Ricardo R., Peir S, Mrquez Caldern S. Influencia de la
presentacin de los resultados de los ensayos clnicos en la intencin de
prescribir: relativizando el riesgo relativo. Aten Primaria 1998; 21:446-450.
2. Bobbio M, Demichelis B, Giustetto G. Completeness of reporting trial results:
effect on physicians' willingness to prescribe. Lancet 1994; 343:1209-1211.
Intervalos de confianza de las medidas de asociacin

Los intervalos de confianza aproximados al 95% para todas las medidas que se
han descrito se calculan como:
el estadstico
se calcula a partir de la tabla

nF
d0
L0
Eventos
Personastiempo
F
d1
L1
Total
d
L
Ejemplo 11:
Para construir el intervalo de confianza de la RDI de la tabla del ejemplo 4,
primero se debe calcular la
Placebo Tratamiento Total
ACV
420
307
727
Personas-ao 11889
11983
23872
y como la RDI estimada es igual a 0,73 el intervalo de confianza queda:
Riesgo relativo Para este ndice y los siguientes la tabla es
Casos
nF
a0
F
a1
No casos
b0
b1
Total
n0
n1
Odds ratio
Reduccin absoluta del riesgo (la frmula es, obviamente, la misma para la
diferencia absoluta de riesgo)
Para la reduccin relativa del riesgo se dividen ambos lmites del intervalo de la
reduccin absoluta por el riesgo en el grupo control y para el nmero necesario
a tratar se invierten los lmites del intervalo de la reduccin absoluta del riesgo.
Ejemplo 12:
Los intervalos de todos los ndices calculados para los datos del ejemplo 5
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
Demostraciones de las propiedades de la probabilidad
Demostraciones de las propiedades de la probabilidad

1) p(Ac) = 1 - p(A)
por ii p(Ac) + p(A) = p() p(Ac) = p() - p(A) y como por iii p()=1 se obtiene 1)
2) A1 A2 p(A1) p(A2)
el suceso B = A1c A2 cumple A1 B = A2 y A1 B = por lo tanto, segn ii) p(A2) = p(A1) + p(B) y segn i)
p(A2) p(A1)
3) p() = 0 por 1) y iii)
4) p(A) 1 por 2 y iii)
5) p(A B) = p(A) + p(B) - p(A B) (Regla general de la adiccin)
A B = A (Ac B) [1]
En la grfica se ve claramente, y ms generalmente
A (Ac B) = (A Ac) (A B) = (A B) = A B
y tambin A (Ac B) = , por lo tanto aplicando ii a [1]
p(A B) = p(A) + p(Ac B) [2]
si en [1] se hace la interseccin con B
B = (A B) (Ac B) [3]
pero A B y Ac B son disjuntos
(A B) (Ac B) = A Ac B B =
por lo tanto aplicando ii) a [3]
p(B) = p(A B) + p(Ac B) == p(Ac B) = p(B) - p(A B)
y sustituyndolo en [2] se obtiene 5
Volver a propiedades de la probabilidad
http://www.hrc.es/bioest/Probabilidad_14_demo.html [02/01/2003 02:30:48]
Demostracin
Demostracin de la Regla de la probabilidad total

B=B = B (A1 A2 ... An) = (B A1) (B A2) ... (B An)
como los Ai son mutuamente excluyentes, tambin lo son B Ai, por lo tanto segn el axioma
ii
p(B) = p(B A1) + p(B A2) + ... + p(B An)
y como p(B Ai) = p(Ai) p(B|Ai) se obtiene la regla de la probabilidad total
Demostracin del Teorema de Bayes
Demostracin del Teorema de Bayes
Usando en el numerador la regla de la multiplicacin y en el denominador la regla de la

probabilidad total
Volver a Teorema de Bayes
Ejemplos de tipos de histograma
Ejemplos de tipos de representaciones grficas

Histogramas: Se agrupan los datos en clases, y se cuenta cuntas observaciones (frecuencia absoluta) hay en
cada una de ellas. En algunas variables (variables cualitativas) las clases estn definidas de modo natural, p.e
sexo con dos clases: mujer, varn o grupo sanguneo con cuatro: A, B, AB, O. En las variables cuantitativas, las
clases hay que definirlas explcitamente (intervalos de clase).
Se representan los intervalos de

clase en el eje de abcisas (eje
horizontal) y las frecuencias,
absolutas o relativas, en el de
ordenadas (eje vertical).
A veces es ms til representar

las frecuencias acumuladas.
O representar simultneamente los

histogramas de una variable en dos
situaciones distintas.
http://www.hrc.es/bioest/Ejemplos_histo.html (1 of 3) [02/01/2003 02:34:30]
Otra forma muy frecuente, de

representar dos histogramas
de la misma variable en dos
situaciones distintas.
Otra ms
En las variables cuantitativas o

en las cualitativas ordinales se
pueden representar polgonos
de frecuencia en lugar de
histogramas, cuando se
representa la frecuencia
acumulativa, se denomina
ojiva.

Bio Estadistica

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Bio Estadistica

Cargado por

Copyright:

Formatos disponibles

Material docente de la Unidad de Bioestadstica Clnica

Material docente de la Unidad de Bioestadstica Clnica

Material docente de la Unidad de Bioestadstica Clnica

2.3.4 Parmetros caractersticos de una fdp

Material docente de la Unidad de Bioestadstica Clnica

4.6 Interpretacin del contraste 1=0

Material docente de la Unidad de Bioestadstica Clnica

6.9 rea bajo la curva ROC

http://www.hrc.es/bioest/M_docente.html (4 of 5) [28/12/2002 18:09:39]

Material docente de la Unidad de Bioestadstica Clnica

9.6 Medidas de asociacin o efecto

http://www.hrc.es/bioest/M_docente.html (5 of 5) [28/12/2002 18:09:39]

http://www.hrc.es/bioest/Probabilidad_1.html [28/12/2002 18:09:56]

http://www.hrc.es/bioest/Probabilidad_12.html [28/12/2002 18:10:24]

Definicin axiomtica de probabilidad

Definicin axiomtica de probabilidad

http://www.hrc.es/bioest/Probabilidad_13.html [28/12/2002 18:10:34]

http://www.hrc.es/bioest/Probabilidad_14.html [28/12/2002 18:10:54]

Esta definicin es consistente, es decir cumple los axiomas de probabilidad.

http://www.hrc.es/bioest/Probabilidad_15.html (1 of 2) [28/12/2002 18:11:13]

En general p(A1 A2 A3 ...) = p(A1) p(A2|A1) p(A3|A1 A2) ...

http://www.hrc.es/bioest/Probabilidad_15.html (2 of 2) [28/12/2002 18:11:13]

y del mismo modo p(B|A) = p(B)

http://www.hrc.es/bioest/Probabilidad_16.html [28/12/2002 18:11:32]

Regla de la PROBABILIDAD total

Regla de la probabilidad total

http://www.hrc.es/bioest/Probabilidad_17.html [28/12/2002 18:12:21]

Si la prueba fuera perfecta b=c=0, desgraciadamente nunca ocurre. Se denomina coeficiente

http://www.hrc.es/bioest/Probabilidad_18.html (2 of 2) [28/12/2002 18:12:55]

Problemas de probabilidad propuestos:

Problemas de probabilidad propuestos:

http://www.hrc.es/bioest/Probabilidad_pro.html [28/12/2002 18:13:09]

Problemas de probabilidad resueltos:

Problemas de probabilidad resueltos:

http://www.hrc.es/bioest/Probabilidad_prosul.html [28/12/2002 18:18:34]

REPASO DE ALGEBRA DE CONJUNTOS

REPASO DE ALGEBRA DE CONJUNTOS

http://www.hrc.es/bioest/Algebra_conjuntos.html (1 of 2) [28/12/2002 18:31:54]

REPASO DE ALGEBRA DE CONJUNTOS

Propiedades de la unin e interseccin

http://www.hrc.es/bioest/Algebra_conjuntos.html (2 of 2) [28/12/2002 18:31:54]

http://www.hrc.es/bioest/estadis_1.html (1 of 2) [28/12/2002 18:41:40]

http://www.hrc.es/bioest/estadis_1.html (2 of 2) [28/12/2002 18:41:40]

Ejemplo: Sean los datos 3, 5, 7, 7, 8, 9

aunque para el clculo se suele usar otra frmula ms cmoda

Desviacin tpica o estndar:

Ojo!! no confundir con error tpico o estndar

http://www.hrc.es/bioest/estadis_2.html (1 of 2) [28/12/2002 18:43:34]

http://www.hrc.es/bioest/estadis_2.html (2 of 2) [28/12/2002 18:43:34]

Pero otra posible v.a.: a cada punto muestral el nmero de s. X: sss

Los conjuntos pueden ser:

http://www.hrc.es/bioest/estadis_21.html (1 of 5) [28/12/2002 18:44:02]

{czz, zcz, zzc}

{ccz, czc, zcc}

A esta funcin se le denomina funcin densidad de probabilidad (fdp), que desgraciadamente

significara que la probabilidad del tipo 2 es 0,27, etc.

http://www.hrc.es/bioest/estadis_21.html (2 of 5) [28/12/2002 18:44:02]

Parmetros caractersticos de una fdp

http://www.hrc.es/bioest/estadis_21.html (3 of 5) [28/12/2002 18:44:02]

Observese que es un nmero que la v.a. no puede alcanzar. Qu significa? No mucho.

Cul es el valor medio de esta funcin?

qu significa? es el valor medio a la larga: si se juega un nmero grande de veces la

aunque para el clculo se suele usar esta otra frmula equivalente: