Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bio Estadistica
Bio Estadistica
1. Teora de la probabilidad
2. Introduccin a la estadstica
3. Anlisis de la varianza
4. Modelos de regresin lineal
5. Precisin y validez de las pruebas diagnsticas
6. Modelos de regresin logstica
7. Modelos de regresin de Poisson
8. Anlisis de Supervivencia
9. Medidas de frecuencia de la enfermedad
1. Teora de la probabilidad
1.1 Idea intuitiva
1.2 Formalizacin de la probabilidad
1.3 Definicin axiomtica de la probabilidad
1.4 Propiedades de la probabilidad
1.5 Probabilidad condicionada
1.6 Sucesos independientes
1.7 Regla de la probabilidad total
1.8 Teorema de Bayes
1.9 Problemas propuestos
Anexo I
Repaso de Algebra de Conjuntos
Definiciones
Propiedades
Funcin de conjunto
2 Estadstica
2.1 Definiciones
2.1.1 Por qu la estadstica?
2.2 Estadstica descriptiva
2.2.1 Mtodos grficos de representacin de datos
2.2.2 Medidas descriptivas
2.2.3.Medidas de posicin
2.2.4 Medidas de dispersin
2.3 Variable aleatoria
2.3.1 Induccin de probabilidad a variables aleatorias
2.3.2 Funcin densidad de probabilidad (fdp)
2.3.3 Funcin acumulativa de probabilidad
http://www.hrc.es/bioest/M_docente.html (1 of 5) [28/12/2002 18:09:39]
TEORIA de la PROBABILIDAD
PROBABILIDAD
V.Abraira
Referencia bibliogrfica
A.Prez de Vargas, V.Abraira. Bioestadstica. Centro de Estudios Ramn Areces. Madrid. 1996.
Idea intuitiva
Nmero, entre 0 y 1, asociado con la verosimilitud de que ocurra un suceso, 0 cuando estamos seguros que el
suceso no va a ocurrir y 1 cuando estamos seguros que s va a ocurrir. El problema es cmo asignar ese nmero
en situaciones de incertidumbre?
a) A veces se estima por la frecuencia relativa. P.e. una manera de aproximarnos a la probabilidad de que una
intervencin quirrgica arriesgada tenga xito es consultar el registro de las intervenciones quirrgicas realizadas
sobre pacientes similares, si de las ltimas 10, ha sido un xito en 8, la frecuencia relativa es 8/10=0,8 se parecer
a esa probabilidad.
La frecuencia relativa cambia, en el ejemplo anterior si el registro, en lugar de 10 pacientes, tuviera 11, la
frecuencia relativa sera necesariamente distinta (8/11 9/11), pero hay una ley emprica que establece que
cuando el "nmero de ensayos" (pacientes, en el ejemplo) es suficientemente grande, la frecuencia relativa se
estabiliza. A veces, se define la probabilidad como el lmite de la frecuencia relativa. Cmo saber, en cada caso,
si el "nmero de ensayos" es suficientemente grande? Una parte de la estadstica tiene que ver con este
problema.
La grfica muestra la evolucin de la
frecuencia relativa del resultado "cara
1" en 4 series de 100 tiradas de un
dado.
Se observa que la frecuencia relativa
oscila, que la amplitud de las
oscilaciones va decreciendo a medida
que aumenta el nmero de tiradas y
que todas las series tienden a
estabilizarse a la misma altura,
tambin que 100 no es un nmero
"suficientemente grande" para que la
frecuencia relativa ya est
estabilizada (los valores finales de las
4 series varan entre 0,17 y 0,21).
b) Hay situaciones en que se puede calcular: si todos los resultados del experimento son igualmente probables,
entonces la probabilidad se define (definicin clsica o de Laplace) como el cociente entre el nmero de casos
favorables y el nmero de casos totales.
La probabilidad de que el resultado de tirar un dado sea un uno, se calculara de esta forma. Comprese el
resultado 1/6 obtenido as con la grfica anterior.
Formalizacin de la probabilidad
Formalizacin de la probabilidad
Convenios: Los textos en color malva corresponden a un mayor nivel de formalizacin y
pueden ser omitidos en una primera lectura.
Experimento Aleatorio: experimento que puede ser repetido bajo "las mismas condiciones", del
que puede establecerse el conjunto de sus posibles resultados, pero no predecir un resultado
concreto.
Espacio muestral: conjunto de posibles resultados.
Punto muestral: elemento del espacio muestral.
Suceso: cualquier subconjunto del espacio muestral.
Si representamos el espacio muestral por y a los sucesos por A: A . Dado que el
conjunto vaco es subconjunto de cualquier conjunto ( ) y que todo conjunto es
subconjunto de s mismo ( ), tanto el conjunto vaco como el espacio muestral son
sucesos.
Si lo necesita Repaso del lgebra de conjuntos
Un problema a tener en cuenta es que dado un experimento, podemos encontrar ms de
un espacio muestral.
Ejemplo 1: una mujer portadora de hemofilia tiene 3 hijos Cul es el espacio muestral
apropiado para estudiar la posible hemofilia de estos?
Opcin a: Cada hijo puede padecer hemofilia (s) o no (n), por tanto
1={sss, ssn, sns, nss, snn, nsn, nns, nnn}
Donde, por ejemplo, 'sns' significa el primero y el tercero la padecen y el segundo no. Hay que
asegurarse que no se olvida ninguno.
En este espacio muestral, el suceso "dos hijos padecen hemofilia" se representa como
A1={ssn, sns, nss} y el suceso "los dos primeros no la padecen" como A2={nns, nnn}
Opcin b: Pueden padecer hemofilia los tres hijos (3), dos (2), ...
2={3, 2, 1, 0}
En este espacio muestral, el suceso "dos hijos padecen hemofilia" es A1={2} y el suceso "los
dos primeros no la padecen" no se puede representar porque en el espacio muestral no est
contemplado el orden.
Propiedades de la probabilidad
Propiedades de la probabilidad
Demostraciones
1) p(Ac) = 1 - p(A)
Ac representa el suceso complementario de A, es decir el formado por todos los resultados que
no estn en A.
2) A1 A2 p(A1) p(A2)
3) p() = 0
4) p(A) 1
5) p(A B) = p(A) + p(B) - p(A B) (Regla general de la adiccin)
Ejemplo 2: Un 15% de los pacientes atendidos en un hospital son hipertensos, un 10% son
obesos y un 3% son hipertensos y obesos. Qu probabilidad hay de que elegido un paciente
al azar sea obeso o hipertenso?
A = {obeso} B = {hipertenso}
A B = {hipertenso y obeso}
A B = {obeso o hipertenso}
p(A) = 0,10; p(B) = 0,15; p(A B) = 0,03
p(A B) = 0,10 + 0,15 - 0,03 = 0,22
Probabilidad condicionada
Probabilidad condicionada
Como la probabilidad est ligada a nuestra ignorancia sobre los resultados de la experiencia,
el hecho de que ocurra un suceso, puede cambiar la probabilidad de los dems. El proceso de
realizar la historia clnica, explorar y realizar pruebas complementarias ilustra este principio.
La probabilidad de que ocurra el suceso A si ha ocurrido el suceso B se denomina probabilidad
condicionada y se define
Probabilidad condicionada
Sucesos independientes
Sucesos independientes
Dos sucesos son independientes si y slo si p(A B) = p(A) p(B).
Si dos sucesos son independientes
Regla de la probabilidad total: Si un conjunto de sucesos Ai forman una particin del espacio
muestral y p(Ai) 0 Ai, para cualquier otro suceso B se cumple
Demostracin
Ejemplo 7: La prevalencia de infarto cardaco para hipertensos es del 0,3% y para no
hipertensos del 0,1%. Si la prevalencia de hipertensin en una cierta poblacin es del 25%
Cul es la prevalencia del infarto en esa poblacin?
A1 = {ser hipertenso} A2 = {no serlo} estos sucesos constituyen una particin
B = {padecer infarto}
datos: p(B|A1) = 0,003; p(B|A2) = 0,001; p(A1) = 0,25
evidentemente p(A2) =0,75 por la propiedad 1
p(B) = 0,003x0,25 + 0,001 x 0,75 = 0,0015
Teorema de Bayes
Teorema de Bayes
Si los sucesos Ai son una particin y B un suceso tal que p(B) 0
Demostracin
Aplicaciones
Diagnstico mdico (en general clasificaciones no biunvocas): El diagnstico consiste en
establecer la enfermedad de un paciente, a partir de una serie de sntomas. Pero los sntomas
y las enfermedades no estn ligados de un modo biunvoco.
Llamemos Ei al conjunto de enfermedades
E1: tuberculosis pulmonar; E2 :cncer de pulmn; E3: bronquitis obstructiva; etc.
y Si a los sntomas y sndromes asociados con las mismas
S1: tos; S2: estado febril; S3: hemotisis; etc.
La informacin accesible en los libros de patologa, o en un archivo de historias clnicas es del
tipo
Para E1: algunos (digamos el 20%) tienen hemotisis; muchos (80%) tienen tos; etc.
y lo mismo para las dems enfermedades
En trminos de probabilidad condicionada, esta informacin es
p(S3|E1) = 0,2; p(S1|E1) = 0,8 etc.
para diagnosticar la tuberculosis se ha de evaluar, para los sntomas que presenta el paciente
p(E1|Si)
para lo que se puede usar el teorema de Bayes si las enfermedades forman una particin (son
mutuamente excluyentes y se consideran todas las enfermedades compatibles con el
sntoma) y se conocen sus prevalencias.
Ntese que un mismo conjunto de sntomas podra dar lugar a un diagnstico diferente en
poblaciones en las que las prevalencias fueran diferentes.
Pruebas diagnsticas: Supngase una prueba diagnstica, por ejemplo nivel de glucosa en
sangre, en ayunas, para diagnosticar la diabetes. Se considera que la prueba es positiva si se
encuentra un nivel por encima de un cierto valor, digamos 120 mg/l.
Para evaluar la prueba, (habr que hacerlo para distintos valores de corte) se somete a la
misma a una serie de individuos diabticos diagnosticados por otro procedimiento (el patrn de
oro o "gold standar") y a una serie de individuos no diabticos. Los resultados se pueden
representar en una tabla de doble entrada
Patrn de oro
NE
Prueba
http://www.hrc.es/bioest/Probabilidad_18.html (1 of 2) [28/12/2002 18:12:55]
Teorema de Bayes
Ntese que ambas dependen de la prevalencia de la enfermedad: una prueba diagnstica que
funciona muy bien en la clnica Mayo, puede ser intil en el Hospital Ramn y Cajal.
Ejemplo 8: una prueba diagnstica para la diabetes tiene un CFP de 4% y un CFN del 5%. Si
la prevalencia de la diabetes en la poblacin donde se usa es del 7% cul es la probabilidad
de que sea diabtico un individuo en el que la prueba d positiva? y de que no lo sea uno en
el que d negativo?
p(+|NE) = 0,04 p(-|NE) = 0,96
p(-|E) = 0,05 p(+|E) = 0,95
p(E) = 0,07 p(NE) = 0,93
Pruebas en serie: Cuando se aplican pruebas en serie, para cada prueba p(E) y p(NE), sern
la p(E|+) y p(NE|+) de la prueba anterior (si dio positiva) o p(E|-) y p(NE|-) si dio negativa.
2 Una prueba diagnstica para el cncer uterino tiene un coeficiente falso-positivo de 0,05 y
falso-negativo de 0,10. Una mujer con una probabilidad pre-prueba de padecer la enfermedad
de 0,15 tiene un resultado negativo con la misma. Calcular la probabilidad de que no est
enferma.
Solucin
Sea NE = {la mujer no est enferma}, + = {el resultado de la prueba es positivo} y - = {el
resultado de la prueba es negativo}. La pregunta pide p(NE|-). Los datos que se dan son
p(+|NE)=0,05; p(-|E)=0,10 y p(E)=0,15. Del primero se deduce que p(-|NE)=0,95 y del ltimo
p(NE)=0,85, por lo tanto aplicando el teorema de Bayes
p(NE|--) = [ p(--|NE) p(NE) ] / [ p(--|NE) p(NE) + p(--|E) p(E) ]
p(NE|--) = [ 0,95 x 0,85 ] / [ 0,95 x 0,85 + 0,10 x 0,15 = 0,982
i) Identidad
A=A
A H = A
ii) Idempotencia
AA=A
AA=A
iii) Commutatividad
AB=BA
AB=BA
iv) Asociatividad
(A B) D = A (B D)
(A B) D = A (B D)
v) Distributividad
(A B) D = (A D) (B D)
(AB) D = (A D) (B D)
vi) Absorcin
A (A B) = A
A (A B) = A
vii) Complementaridad
A Ac = H
A Ac =
Nota: A todo conjunto en el que se hayan definido dos operaciones que tengan estas propiedades, se le denomina
Algebra de Boole.
Funcin de conjunto: toda regla que de un modo perfectamente determinado haga corresponder un nmero real a
cada elemento del conjunto. Se representa por
f: A
el nmero x que le corresponde al elemento a, se representa por x=f(a)
Se denomina imagen de la funcin al conjunto de nmeros que estn en correspondencia con algn elemento, a
travs de la funcin.
im f = { x ; a A , f(a)=x }
Volver
Ir a Bioestadstica
Estadstica
ESTADISTICA
V.Abraira
Referencia bibliogrfica
A.Prez de Vargas, V.Abraira. Bioestadstica. Centro de Estudios Ramn Areces. Madrid.
1996.
Definiciones
Conjunto de mtodos cientficos ligados a la toma, organizacin, recopilacin, presentacin
y anlisis de datos, tanto para la deduccin de conclusiones como para tomar decisiones
razonables de acuerdo con tales anlisis.
Arte de la decisin en presencia de incertidumbre.
Ciencia que sirve para demostrar que dos personas han comido 1/2 pollo cada una, cuando
en realidad una ha comido uno y la otra ninguno.
Por qu la estadstica?
Usaron la estadstica Galileo, Newton y Einstein?
En ciertas ciencias (Biologa, Ciencias Humanas, algunos campos de la Fsica, ...) aparece el
concepto de experimento aleatorio (experimento que repetido en las "mismas condiciones" no
produce el mismo resultado) y asociado al mismo el de variable aleatoria.
Una variable no aleatoria (asociada al resultado de una experiencia que s produce el mismo
resultado) est caracterizada por un valor para cada condicin.
Una variable aleatoria est caracterizada por la llamada funcin densidad de probabilidad, a
partir de la cual se obtienen las probabilidades para sus posibles valores para cada condicin.
Los objetivos de la investigacin cientfica se pueden entender, de un modo muy general, en
trminos de encontrar y describir las variables de inters y las relaciones entre ellas, para el
problema en estudio.
La estadstica es la ciencia que estudia los mtodos que permiten realizar este proceso para
variables aleatorias. Estos mtodos permiten resumir datos y acotar el papel de la casualidad
(azar).
Se divide en dos reas:
Estadstica descriptiva: Trata de describir las variables aleatorias en las "muestras".
Estadstica inductiva o inferencial: Trata de la generalizacin hacia las poblaciones de los
resultados obtenidos en las muestras y de las condiciones bajo las cuales estas conclusiones
son vlidas. Se enfrenta bsicamente con dos tipos de problemas:
Estimacin, que puede ser puntual o por intervalos.
Estadstica
Contraste de hiptesis.
ESTADISTICA DESCRIPTIVA
La descripcin completa de una variable aleatoria est dada por su funcin densidad de
probabilidad (fdp).
Afortunadamente una gran cantidad de variables de muy diversos campos estn
adecuadamente descritas por unas pocas familias de fdps: binomial, Poisson, normal, gamma,
etc.
Dentro de cada familia, cada fdp est caracterizada por unos pocos parmetros, tpicamente
dos: media y varianza.
Por tanto la descripcin de una variable indicar la familia a que pertenece la fdp y los
parmetros correspondientes.
Ejemplo: (hipottico) la concentracin de glucosa en sangre en individuos no diabticos,
medida en mg/dl, es normal con media 98 y varianza 90.
El problema es cmo averiguar la fdp de una variable de inters?
La familia, generalmente, se sabe por resultados de la teora de la probabilidad, aunque, en
cada caso, conviene verificarlo. Para conocer los parmetros se deberan conocer los
resultados de todos los posibles experimentos (poblacin: conjunto de todos los valores de
una variable aleatoria). Generalmente la poblacin es inaccesible, bien es infinita, o aunque
finita suficientemente grande para ser inabordable. En consecuencia, se estudian muestras
(subconjuntos de la poblacin) que, en caso de ser aleatorias, permiten realizar estimaciones
tanto de la familia como de los parmetros de las fdps.
Muestra aleatoria: muestra elegida independientemente de todas las dems, con la misma
probabilidad que cualquier otra y cuyos elementos estn elegidos independientemente unos de
otros y con la misma probabilidad.
Mtodos grficos de representacin de muestras: El mtodo grfico ms frecuente es el
histograma, que puede adoptar distintas formas. Vanse algunos ejemplos.
Advertencias:
1 Estos diagramas tienen un fin descriptivo: deben ser fciles de leer.
2 El convenio es que la frecuencia sea proporcional al rea (es proporcional a la altura slo si
las barras tienen la misma anchura).
3 Para fines comparativos es mejor usar frecuencias relativas.
4 El nmero de clases (barras), cuando la variable no es cualitativa, no debe ser ni muy
grande ni muy pequeo. Generalmente se recomiendan entre 5 y 20 clases de igual tamao.
Otro criterio es usar la raz cuadrada del nmero de datos.
5 Los lmites de las clases no deben ser ambiguos, p.e. no deben coincidir con valores
posibles de los datos (una cifra decimal ms).
Medidas descriptivas
MEDIDAS DESCRIPTIVAS
Medidas de posicin o tendencia
Media muestral: Si tenemos X1, X2, ... , Xn datos, se llama media muestral de los mismos a su
media aritmtica
Moda muestral: El valor que ms se repite (puede no existir y si existe puede no ser nica).
Mediana muestral: Ordenando los Xi, el valor que est en el medio
= 7; moda = 7
Medidas de dispersin
Rango: Si Xi estn ordenados Xn - X1
Varianza:
Medidas descriptivas
VARIABLE ALEATORIA
Variable aleatoria
Una funcin que asocia un nmero real, perfectamente definido, a cada punto muestral.
A veces las variables aleatorias (v.a.) estn ya implcitas en los puntos muestrales.
Ejemplo 1: Experiencia consistente en medir la presin sistlica de 100 individuos. Un punto
muestral (resultado de un experimento) es ya un nmero (presin sistlica). La v.a. est
implcita.
Ejemplo 2: En el ejemplo de la mujer portadora de hemofilia.
= {sss, ssn, sns, snn, nss, nsn, nns, nnn}
Se podra definir una variable que asignara a cada punto muestral el nmero de orden en el
espacio muestral.
X: sss
1; ssn
2; sns
3;...
3; ssn
2; ...
VARIABLE ALEATORIA
Sucesos
px
{zzz}
1/8
3/8
3/8
{ccc}
1/8
f(x)
0,22
0,27
0,30
0,21
VARIABLE ALEATORIA
Para las variables aleatorias de inters hay tablas, y programas de ordenador, donde buscar
esos valores.
Distribucin acumulativa o funcin de distribucin
F(x) = p(X x)
Para el ejemplo 3
f(x)
F(x)
1/8
1/8
3/8
4/8
3/8
7/8
1/8
8/8
y para el ejemplo 4
f(x)
F(x)
0,22
0,22
0,27
0,49
0,30
0,79
0,21
si X es una v.a. cualquier funcin de ella, h(x), es tambin una v.a., en consecuencia tambin
se define este parmetro para una funcin de v.a.
VARIABLE ALEATORIA
Ejemplo 5: Se tira un dado. Se define como v.a. el nmero que sale Cul es su media?
La variable X puede tomar los valores 1, 2, ..., 6 y para todos ellos f(x) = 1/6. En consecuencia
la media es
h(x)
100
100
500
VARIABLE ALEATORIA
f(x)
0,01
0,1
0,3
0,4
0,1
a. Encontrar f(5)
b. Construir F(x)
c. Encontrar p(X2)
d. Encontrar p(X<2)
e. Encontrar p(X>3)
f. Calcular la media y la varianza
Solucin
3 Se desarrolla un compuesto para aliviar las migraas. El fabricante afirma que es efectivo en un 90% de los casos. Se
prueba sobre 4 pacientes. Sea X el nmero de pacientes que obtiene alivio.
a. Encontrar la fdp para X, suponiendo que la afirmacin del fabricante sea correcta.
b. Encontrar p(X1)
c. Si el compuesto no alivia a ninguno de los pacientes es esa una razn para poner en duda la eficacia afirmada por el
fabricante? Razonar sobre la base de la probabilidad implicada.
d. Calcular la media. Qu significa en este ejemplo?
Solucin
4 Sea X el tiempo de supervivencia en aos despus de un diagnstico de leucemia aguda. La fdp para X es f(x) = -x/2
+ 1, para 0 < x < 2.
a. Comprobar que es una fdp.
b. Hallar p(X>1)
c. Hallar p(X=1)
d. Hallar p(X1)
Ayuda: hacerlo todo grficamente
e. Calcular la media y la varianza (Slo para iniciados).
Solucin
Sucesos
f(x)
{(1,1)}
1/36
{(1,2), (2,1)}
2/36
3/36
4/36
5/36
6/36
5/36
4/36
10
3/36
11
{(5,6), (6,5)}
2/36
12
{(6,6)}
1/36
h(x)
100
100
100
10
300
11
300
12
300
en consecuencia, la apuesta debera costar 91,7 + 50 = 141,7 para que la ganancia esperada de la banca sea 50 ptas.
2 La siguiente tabla muestra la fdp para la variable X: nmero de personas por da que solicitan un tratamiento
innecesario en el servicio de urgencias de un pequeo hospital.
http://www.hrc.es/bioest/estadis_prosul.html (1 of 4) [28/12/2002 18:45:31]
f(x)
0,01
0,1
0,3
0,4
0,1
a. Encontrar f(5)
b. Construir F(x)
c. Encontrar p(X2)
d. Encontrar p(X<2)
e. Encontrar p(X>3)
f. Calcular la media y la varianza
Solucin
a. Por la construccin de las fdps es obvio que
.
Para que se cumpla esta condicin es necesario que f(5)=0,09
b.
f(x)
0,01
0,1
0,3
0,4
0,1
0,09
F(x)
0,01
0,11
0,41
0,81
0,91
3 Se desarrolla un compuesto para aliviar las migraas. El fabricante afirma que es efectivo en un 90% de los casos. Se
prueba sobre 4 pacientes. Sea X el nmero de pacientes que obtiene alivio.
a. Encontrar la fdp para X, suponiendo que la afirmacin del fabricante sea correcta.
b. Encontrar p(X1)
c. Si el compuesto no alivia a ninguno de los pacientes es esa una razn para poner en duda la eficacia afirmada por el
fabricante? Razonar sobre la base de la probabilidad implicada.
d. Calcular la media. Qu significa en este ejemplo?
Solucin
a. Representando por a que un paciente tenga alivio y por n que no lo tenga, el espacio muestral para el problema es
= {aaaa, naaa, anaa, aana, aaan, ..., nnnn}, Si es cierta la afirmacin del fabricante p(a)=0,9 y p(n)=0,1
La v.a. X: nmero de pacientes que tienen alivio puede tomar los valores 0, 1, 2, 3, 4. La tabla con la fdp inducida es
x
Sucesos
f(x)
0,14
{nnnn}
4x0,9x0,13
6x0,92x0,12
{aaaa}
4x0,93x0,1
0,94
4 Sea X el tiempo de supervivencia en aos despus de un diagnstico de leucemia aguda. La fdp para X es f(x) = -x/2
+ 1, para 0 < x < 2.
a. Comprobar que es una fdp.
b. Hallar p(X>1)
c. Hallar p(X=1)
d. Hallar p(X1)
Ayuda: hacerlo todo grficamente
e. Calcular la media y la varianza (Slo para iniciados).
Solucin
a. La grfica de la fdp es
La condicin equivalente a
b.
Grficamente, la probabilidad pedida es el rea coloreada de
verde, por lo tanto se puede calcular tambin con la frmula
del rea del tringulo. Ahora b=1 y para calcular h hay que
ver que valor toma la fdp cuando x=1, y = -1/2 + 1 = 1/2. Por
lo tanto, la probabilidad es (1x1/2)/2 = 1/4
c. Como en toda variable continua la probabilidad de que tome un valor concreto es 0, por lo tanto p(X=1) = 0
d. Obviamente p(X1) = p(X >1) = 1/4
e. Media
varianza
Estadstica inferencial
Los dos tipos de problemas que resuelven las tcnicas estadsticas son: estimacin y contraste
de hiptesis. En ambos casos se trata de generalizar la informacin obtenida en una muestra a
una poblacin. Estas tcnicas exigen que la muestra sea aleatoria. En la prctica rara vez se
dispone de muestras aleatorias, por la tanto la situacin habitual es la que se esquematiza en
la figura
Entre la muestra con la que se trabaja y la poblacin de inters, o poblacin diana, aparece la
denominada poblacin de muestreo: poblacin (la mayor parte de las veces no definida con
precisin) de la cual nuestra muestra es una muestra aleatoria. En consecuencia la
generalizacin est amenazada por dos posibles tipos de errores: error aleatorio que es el que
las tcnicas estadsticas permiten cuantificar y crticamente dependiente del tamao muestral,
pero tambin de la variabilidad de la variable a estudiar y el error sistemtico que tiene que ver
con la diferencia entre la poblacin de muestreo y la poblacin diana y que slo puede ser
controlado por el diseo del estudio.
Tamao muestral
El tamao muestral juega el mismo papel en estadstica que el aumento de la lente en
microscopa: si no se ve una bacteria al microscopio, puede ocurrir que:
- la preparacin no la contenga
- el aumento de la lente sea insuficiente.
Para decidir el aumento adecuado hay que tener una idea del tamao del objeto.
Del mismo modo, para decidir el tamao muestral:
i) en un problema de estimacin hay que tener una idea de la magnitud a estimar y del error
aceptable.
ii) en un contraste de hiptesis hay que saber el tamao del efecto que se quiere ver.
Estimacin de parmetros
Estimacin de parmetros
En general, de las variables experimentales u observacionales no conocemos la fpd. Podemos
conocer la familia (normal, binomial,...) pero no los parmetros. Para calcularlos
necesitaramos tener todos los posibles valores de la variable, lo que no suele ser posible.
La inferencia estadstica trata de cmo obtener informacin (inferir) sobre los parmetros a
partir de subconjuntos de valores (muestras) de la variable.
Estadstico: variable aleatoria que slo depende de la muestra aleatoria elegida para
calcularla.
Estimacin: Proceso por el que se trata de averiguar un parmetro de la poblacin
representado, en general, por a partir del valor de un estadstico llamado estimador y
representado por
El problema se resuelve en base al conocimiento de la "distribucin muestral" del estadstico
que se use.
Qu es esto? Concretemos, p.e. en la media (). Si para cada muestra posible calculamos la
media muestral (
aleatoria y slo depende de la muestra), habr por tanto una fpd para , llamada distribucin
muestral de medias. La desviacin tpica de esta distribucin se denomina error tpico de la
media. Evidentemente, habr una distribucin muestral para cada estadstico, no slo para la
media, y en consecuencia un error tpico para cada estadstico.
Si la distribucin muestral de un estadstico estuviera relacionada con algn parmetro de
inters, ese estadstico podra ser un estimador del parmetro.
es el error tpico, o
Recurdese que la probabilidad de que est en este intervalo es 1 - . A un intervalo de este tipo se le denomina
intervalo de confianza con un nivel de confianza del 100(1 - )%, o nivel de significacin de 100%. El nivel de
confianza habitual es el 95%, en cuyo caso =0,05 y z /2=1,96. Al valor
se dice que
es un estimador de .
Ejemplo: Si de una poblacin normal con varianza 4 se extrae una muestra aleatoria de tamao 20 en la que se
calcula
se puede decir que tiene una probabilidad de 0,95 de estar comprendida en el intervalo
Este manera de construir los intervalos de confianza slo es vlido si la variable es normal. Cuando n es grande
(>30) se puede sustituir t por z sin mucho error.
Otras lecturas recomendadas
Interpreting study results: confidence intervals. Guyatt et al. CMAJ. 152:169-173. 1995
Estimacin de proporciones
Estimacin de proporciones
Sea X una variable binomial de parmetros n y p (una variable binomial es el nmero de xitos
en n ensayos; en cada ensayo la probabilidad de xito (p) es la misma, por ejemplo: nmero
de diabticos en 2000 personas).
Si n es grande y p no est prximo a 0 1 (np 5) X es aproximadamente normal con media
np y varianza npq (siendo q = 1 - p) y se puede usar el estadstico
(proporcin
muestral), que es tambin aproximadamente normal, con error tpico dado por
en consecuencia, un IC para p al 100(1 - )% ser
Solucin
2 Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo.
Se eligen aleatoriamente a 100 de ellos y se les suministra la vacuna; de ellos 10 pasan la
gripe. Construir un IC al 95% para la probabilidad de pasar la gripe si se est vacunado. En los
otros 100 pacientes sin vacunar la pasan 20. Hay evidencia de que la vacuna es eficaz?
Solucin
Solucin
Usando la frmula general para cuando 2 es desconocida
Para poder usar esta frmula es necesario que la variable sea normal. es abusiva esta
asuncin? Ver, por ejemplo The normal distribution. Altman & Bland. BMJ 1995; 310:298.
2 Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo.
Se eligen aleatoriamente a 100 de ellos y se les suministra la vacuna; de ellos 10 pasan la
gripe. Construir un IC al 95% para la probabilidad de pasar la gripe si se est vacunado. En los
otros 100 pacientes sin vacunar la pasan 20. Hay evidencia de que la vacuna es eficaz?
Solucin
La frmula para calcular IC para proporciones es
es decir, hay una probabilidad del 95% de que la probabilidad de pasar la gripe si se est
vacunado est comprendida entre el 4% y el 16%. Para los no vacunados
Existe solapamiento, aunque pequeo, entre ambos intervalos; por tanto no podemos asegurar
que la vacuna sea eficaz.
http://www.hrc.es/bioest/estadis_pro2sul.html (1 of 2) [28/12/2002 18:50:58]
Contrastes de hiptesis
Contrastes de hiptesis
Una hiptesis estadstica es una asuncin relativa a una o varias poblaciones,
que puede ser cierta o no. Las hiptesis estadsticas se pueden contrastar con
la informacin extrada de las muestras y tanto si se aceptan como si se
rechazan se puede cometer un error.
La hiptesis formulada con intencin de rechazarla se llama hiptesis nula y se
representa por H0. Rechazar H0 implica aceptar una hiptesis alternativa (H1).
La situacin se puede esquematizar:
H0 rechazada
H0 cierta
H0 falsa
H1 cierta
Error tipo I ()
Error tipo II ()
Contrastes de hiptesis
2. la hiptesis alternativa
Contrastes de hiptesis
no est en la regin crtica (no es mayor que 1,69), por tanto no rechazamos H0.
Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes
estadsticos) es buscar en las tablas el "valor p" que corresponde a T=0,833,
que para 35 g.l. es aproximadamente 0,20. Es decir, si H0 fuera cierta, la
probabilidad de encontrar un valor de T como el que hemos encontrado o mayor
(por qu mayor? Porque la H1 es que es mayor , lo que producira una media
muestral mayor y por tanto mayor valor de t) es 0,20, dicho de otra manera la
probabilidad de equivocarnos si rechazamos H0 es 0,20, como la frontera se
establece en 0,05 no la rechazamos.
Este valor crtico de 0,05 es arbitrario pero es la convencin habitual. Cun
razonable es?
Problema al respecto: en la hiptesis de que un mazo de cartas est bien
barajado, la probabilidad de que al sacar dos cartas sean, p.e.:1 el as de oros y
2 el rey de bastos es 1/40 x 1/39=0,000833.
Si hacemos la experiencia y obtenemos ese resultado rechazaramos la
hiptesis de que el mazo est bien barajado? Cunto se parece esto a la lgica
del contraste de hiptesis?
Volvamos al problema del estrs. Como no se rechaza H0, se puede cometer un
error tipo II. Cul es ?. De hecho, sera la informacin relevante a comunicar
en este estudio (la probabilidad del error que se pude cometer en l).
Habitualmente, sin embargo, no se da porque los paquetes estadsticos no la
calculan.
Para calcularla se debe concretar H1, p.e. = 20 (el criterio para este valor no
es estadstico)
Contrastes de hiptesis
es decir, se acepta H0 si
Qu probabilidad hay de encontrar
si = 20 (zona verde del grfico)?
En esta hiptesis lo que se distribuye como una z es
resulta que
Si el contraste fuera a dos colas habra que cambiar z por z/2
Comparacin de medias
Comparacin de medias
La hiptesis nula
H0: 1 2 = d0
Generalmente d0=0
Hay 3 situaciones distintas:
1
= 3,7 mm de
Comparacin de medias
Y el programa calcula la t para varianzas iguales y distintas y realiza el contraste para las varianzas. Para el
contraste sobre las varianza el SPSS no usa la prueba descrita ms arriba, sino la de Levene que no asume
normalidad y se puede usar para comparar varias varianzas.
Estadsticos del grupo
TRATA
Media
35
3,729
5,666
,958
40
15,075
3,576
,565
DIFEREN
DIFEREN
Se han
asumido
varianzas
iguales
No se han
asumido
varianzas
iguales
10,431
Sig.
,002
gl Sig. (bilateral)
Diferencia de
medias
Superior
-10,503
73
,000
-11,346
1,080
-13,500
-9,193
-10,201
55,909
,000
-11,346
1,112
-13,575
-9,118
Qu nos est diciendo este resultado? Que si el tratamiento fuera igual de eficaz que el placebo, la
probabilidad de haber obtenido una diferencia entre ambos como la que hemos encontrado o mayor es muy
pequea (<0,000) Bastara esto para convencernos de que debemos tratar con este tratamiento?
Comparacin de medias
nF
m = a+b
nE
n = c+d
e = a+c
f = b+d
Se estudian T individuos, a tienen al factor (F) y tiene xito la terapia (E), b no tienen al factor (nF) y tiene xito la
terapia, ...
Ojo! A pesar de la aparente "inocencia" de esta tabla, puede significar cosas distintas segun el diseo del
estudio. No todas las probabilidades de las que se habla ms abajo se pueden estimar siempre.
H0 es que el factor F y el xito E son independientes (F no es factor pronstico) y H1 que estn asociados (s es
factor pronstico). Si son independientes p(EF) = p(E)p(F). A partir de los datos de la tabla las mejores
estimaciones de estas probabilidades son
, por lo tanto en H0
que se distribuye segn una distribucin conocida denominada ji-cuadrado, que depende de un parmetro
llamado "grados de libertad" (g.l.) Los g.l. en esta tabla son 1. Esto se puede generalizar a tablas CxF y los
grados de libertad son (C-1)x(F-1).
Ejemplo
En una muestra de 100 pacientes que sufrieron infarto de miocardio se observa que 75 sobrevivieron ms de 5
aos (xito). Se quiere estudiar su posible asociacin con la realizacin de ejercicio moderado (factor). La tabla
es
F
nF
50
25
75
nE
10
15
25
60
40
100
nF
60x75/100=45
40x75/100=30
nE
60x25/100=15
40x25/100=10
Obsrvese que una vez calculado uno de los valores esperados, los dems vienen dados para conservar los
totales marginales (eso es lo que significa que hay 1 g.l.). A partir de aqu calculamos
Rechazamos la H0 y concluimos que hay asociacin entre el ejercicio y la supervivencia. Obviamente esta
asociacin no es necesariamente causal.
Nota: Para hacerlo con un paquete estadstico, p.e. el SPSS, deberamos crear un archivo con 2 variables: Super
con un cdigo distinto para cada grupo, p.e. 1 para supervivencia y 0 para no y Ejer tambin con dos cdigos.
Para calcular la ji-cuadrado desplegamos los mens que se ven en la grfica:
y la salida es
Tabla de contingencia EJERC * SUPER
Recuento
SUPER
EJERC
Total
15
25
40
10
50
60
25
75
100
Total
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Valor
gl
Sig. asint.
(bilateral)
5,556
,018
Correccin de continuidad
4,500
,034
Razn de verosimilitud
5,475
,019
,033
5,500
N de casos vlidos
100
,019
,017
4 Odds ratio (OR): Es un estadstico menos intuitivo que el RR. Para caracterizar un proceso
binomial se puede usar su probabilidad (p) o el cociente p/q llamado odds. En el ejemplo
anterior, para el ejercicio p = 0,83 y el odds = 0,83/0,17=4,88, es decir es 4,88 veces ms
probable tener xito que no tenerlo si se hace ejercicio y para el no ejercicio p = 0,63 y el odds
= 0,63/0,37=1,70. Para comparar ambos procesos podemos usar su cociente u odds ratio OR
= 4,88/1,70 = 2,87. El odds para el ejercicio es 2,87 veces mayor que para el no ejercicio. El
nV
10
20
30
nG
90
80
170
100
100
200
nV
100x30/200=15
100x30/200=15
nG
100x170/200=85
100x170/200=85
Calculamos el estadstico 2
Solucin
a. Llamando a a la concentracin media antes y d a la concentracin media ahora, las
hiptesis se plantean
H0: a = d
H1: a > d
b. Error tipo I = (rechazar H0|H0 cierta) es decir concluir que la concentracin ha disminuido,
cuando en realidad no ha sido as.
Error tipo II = (aceptar H0|H0 falsa) es decir concluir que la concentracin no ha disminuido,
cuando en realidad si ha disminuido
c. El diseo garantiza que si la concentracin media ha disminuido 6 ppm o ms el estudio
tiene una probabilidad de 0,8 de detectarlo.
3 En un estudio caso-control para estudiar la posible asociacin entre estado civil y mortalidad
en la UVI se ha encontrado que de 50 personas que murieron 30 eran solteros, mientras que
entre 60 que sobrevivieron slo lo eran 15. Plantear y resolver el contraste. Cul sera el
mejor estimador del efecto?
Solucin
H0: No hay asociacin entre el estado civil y la mortalidad
Construimos la tabla
Soltero
No
Morir
30
20
50
No
15
45
60
45
65
110
no
Morir
45x50/110=20,5
65x50/110=29,5
No
45x60/110=24,5
65x60/110=35,5
Calculamos el estadstico 2
Introduccin a la causalidad
Introduccin a la causalidad
1 Causalidad en la vida comn: Parece que forma parte de la mente humana el buscar relaciones entre las
cosas y particularmente entre acciones y sus consecuencias como modo de entender el mundo y adaptarse
al mismo. Ya figura en el aprendizaje del nio, incluso la repeticin.
Sin embargo en el lenguaje comn e incluso literario se usa con mucha laxitud:
"Un hombre entr en un local provocando una nube de humo, se alis el cabello provocando la aparicin de
un barman de aspecto feroz". Queneau.
"Sobre como la divina providencia regula la igualdad en el nacimiento de los sexos". Arthunot.
2 Causalidad en la filosofa: Para Aristteles (visin finalista) existen 4 tipos de causa:
Causa material: el mrmol para una estatua,la existencia del miocardio y su necesidad de riego sanguneo
para el infarto de miocardio.
Causa eficiente: la mano del escultor para la estatua, el trombo para el infarto.
Causa formal: el canon de belleza para la estatua, la necesidad de nutrientes para el infarto.
Causa final: depende de posiciones "a priori": el aumento de la belleza en el mundo para la estatua, para la
regulacin de la poblacin en el mundo o para que existan cardilogos para el infarto.
Evidentemente estos conceptos se solapan.
No es infrecuente encontrar esta visin finalista en Biologa: "El sistema inmunolgico est para defender al
individuo de ataques externos".
Otras posiciones:
i) ontolgica (Leibniz): La causalidad es un principio del ser. "Las leyes causales que una cosa cumple
constituyen un aspecto fundamental e inseparable de su modo de ser". D. Bohm.
ii) legalista (Hume): La causalidad es la forma en que se expresan las leyes cientficas basadas en una
generalizacin de la experiencia y con capacidad predictiva. Las caractersticas de la relacin causal son:
a) contigidad (causa y efecto deben estar contiguos en espacio y tiempo).
b) prioridad (la causa precede en el tiempo al efecto).
c) conjuncin constante (las relaciones anteriores deben conservarse en varios casos).
iii) a priorista (Kant): La causalidad es un "a priori" que se necesita para el conocimiento racional. No procede
del conocimiento, es un supuesto previo que lo hace posible.
iv) escptica: "La razn por la que la fsica ha dejado de buscar las causas es que en realidad no existen. La
Ley de causalidad como mucho de lo que se da por bueno entre los filsofos, es una reliquia de una poca
pasada que sobrevive, como la monarqua, porque se supone errneamente que no hace ningn dao". B.
Russell.
3 Elementos de la relacin causal
1 Elemento inicial (A) o causa: su definicin depende del modelo. Pueden ser causas:
a) Acciones intencionales (p.e. administracin de un tratamiento): las ms claras
b) Acciones no intencionales: acciones naturales (lluvia), hechos (fumar),...
c) Atributos (sexo), constructos (inteligencia): como no se definen en funcin de cambios, a veces en lugar de
causas se habla de determinantes.
2 Elemento final (B) o efecto que se define en trminos de cambio con respecto a:
a) situacin previa
b) lo que hubiera ocurrido si no hubiera ocurrido la causa. Es la que plantea ms problemas en el diseo
experimental: necesidad de control.
3 Relacin entre ambos
a) Algunos autores (Russell) la definen exclusivamente como funcional en el sentido de funcin matemtica.
b) Otros (Galileo, Stuart Mill, Kant) tambin como condicin. La relacin condicional puede ser:
i) Necesaria y suficiente: Si A, entonces B y Si B, entonces A.
ii) Necesaria y no suficiente: Si A, entonces B o no B y Si B, entonces A
iii) No necesaria y suficiente: Si A, entonces B y Si B, entonces A o no A
iv) No necesaria y no suficiente: Si A, entonces B o no B y Si B, entonces A o no A
http://www.hrc.es/bioest/causali.html (1 of 3) [28/12/2002 19:01:45]
Introduccin a la causalidad
Introduccin a la causalidad
Anlisis de la varianza
ANLISIS DE LA VARIANZA
V. Abraira
Bibliografa:
V. Abraira, A. Prez de Vargas
Mtodos Multivariantes en Bioestadstica.
Ed. Centro de Estudios Ramn Areces. 1996.
Anlisis de la varianza
El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para
comparar dos o ms medias, que es necesario porque cuando se quiere
comparar ms de dos medias es incorrecto utilizar repetidamente el contraste
basado en la t de Student. por dos motivos:
En primer lugar, y como se realizaran simultnea e independientemente varios
contrastes de hiptesis, la probabilidad de encontrar alguno significativo por azar
aumentara. En cada contraste se rechaza la H0 si la t supera el nivel crtico,
para lo que, en la hiptesis nula, hay una probabilidad . Si se realizan m
contrastes independientes, la probabilidad de que, en la hiptesis nula, ningn
estadstico supere el valor crtico es (1 - )m, por lo tanto, la probabilidad de que
alguno lo supere es 1 - (1 - )m, que para valores de prximos a 0 es
aproximadamente igual a m. Una primera solucin, denominada mtodo de
Bonferroni, consiste en bajar el valor de , usando en su lugar /m, aunque
resulta un mtodo muy conservador.
Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras
provienen de la misma poblacin, por lo tanto, cuando se hayan realizado todas
las comparaciones, la hiptesis nula es que todas las muestras provienen de la
misma poblacin y, sin embargo, para cada comparacin, la estimacin de la
varianza necesaria para el contraste es distinta, pues se ha hecho en base a
muestras distintas.
El mtodo que resuelve ambos problemas es el anova, aunque es algo ms que
esto: es un mtodo que permite comparar varias medias en diversas
situaciones; muy ligado, por tanto, al diseo de experimentos y, de alguna
manera, es la base del anlisis multivariante.
Anlisis de la varianza
Anlisis de la varianza
G.L.
SS
MS
k-1
SSA
SSA/(k-1)
MSA/MSE
(n-1)k
SSE
SSE/k(n-1)
kn-1
SST
Algunas propiedades
Es fcil ver en la tabla anterior que
GLerror+ GLtrata = (n - 1) k + k - 1 = nk - k + k - 1 = nk - 1 = GLtotal
No es tan inmediato, pero las sumas de cuadrados cumplen la misma
propiedad, llamada identidad o propiedad aditiva de la suma de cuadrados:
Ejemplo de anova
Ejemplo 1
Se quiere evaluar la eficacia de distintas dosis de un frmaco contra la
hipertensin arterial, comparndola con la de una dieta sin sal. Para ello
se seleccionan al azar 25 hipertensos y se distribuyen aleatoriamente en
5 grupos. Al primero de ellos no se le suministra ningn tratamiento, al
segundo una dieta con un contenido pobre en sal, al tercero una dieta sin
sal, al cuarto el frmaco a una dosis determinada y al quinto el mismo
frmaco a otra dosis. Las presiones arteriales sistlicas de los 25 sujetos
al finalizar los tratamientos son:
Grupo
1
180
172
163
158
147
173
158
170
146
152
175
167
158
160
143
182
160
162
171
155
181
175
170
155
160
SS
MS
Tratamiento
2010,64
502,66
11,24
Error
20
894,4
44,72
Total
24
2905,04
Fuente de variacin
Nota: Para hacerlo con un paquete estadstico, p.e. el SPSS, deberamos crear
un archivo con 2 variables: Trata (con un cdigo distinto para cada grupo, p.e.
de 1 a 5) y Presion con la presin arterial de cada individuo al acabar el estudio.
Para calcular el Anova desplegamos los mens que se ven en la grfica:
Ejemplo de anova
Pruebas a posteriori
En general, en un modelo II el inters del investigador es averiguar si existe
componente aadida y en su caso estimarla.
Sin embargo, en un modelo I, lo que tiene inters son las diferencias entre los
distintos grupos.
En el Ejemplo 1, lo que interesa, una vez visto que la presin arterial media es
diferente para los cinco grupos, es, por ejemplo, estimar el efecto de la dieta sin
sal, 3 1, o el aumento del efecto de la segunda dosis del frmaco con
respecto a la primera dosis 5 4.
Las pruebas "a posteriori" son un conjunto de pruebas para probar todas las
posibles hiptesis del tipo i j = 0.
Existen varias, (Duncan, Newman-Keuls, LSD): todas ellas muy parecidas. Usan
el rango (diferencia entre medias) de todos los pares de muestras como
estadstico y dicho rango debe superar un cierto valor llamado mnimo rango
significativo para considerar la diferencia significativa.
La principal diferencia con respecto a la t de Student radica en que usan MSE
como estimador de la varianza, es decir un estimador basado en todas las
muestras.
Una manera semigrfica habitual de representar los resultados es dibujar una
lnea que una cada subconjunto de medias adyacentes entre las que no haya
diferencias significativas.
Para los datos del Ejemplo 1 la salida semigrfica para la prueba LSD de, por
ejemplo, el Statgraphics es
El primer subndice indica el nivel del primer factor, el segundo el nivel del segundo
factor y el tercero la observacin dentro de la muestra. Los factores pueden ser
ambos de efectos fijos (se habla entonces de modelo I), de efectos aleatorios
(modelo II) o uno de efectos fijos y el otro de efectos aleatorios (modelo mixto). El
modelo matemtico de este anlisis es:
modelo I
modelo II
modelo mixto
donde es la media global, i o Ai el efecto del nivel i del 1 factor, j o Bj el efecto
del nivel j del 2 factor y ijk las desviaciones aleatorias alrededor de las medias,
que tambin se asume que estn normalmente distribuidas, son independientes y
tienen media 0 y varianza 2.
A las condiciones de muestreo aleatorio, normalidad e independencia, este modelo
aade la de aditividad de los efectos de los factores.
A los trminos ()ij, (AB)ij, (B)ij, se les denomina interaccin entre ambos factores
http://www.hrc.es/bioest/Anova_10.html (1 of 3) [28/12/2002 19:11:37]
referencia).
GL
SS
MS
1 factor
a -1
SSA
SSA/(a - 1)
2 factor
b-1
SSB
SSB/(b - 1)
(a - 1)(b - 1)
SSAB
Error
ab(n - 1)
SSE
SSE/[ab(n - 1)]
Total
abn - 1
SST
Interaccin
Para plantear los contrastes de hiptesis hay que calcular los valores esperados de
los distintos cuadrados medios.
Modelo I
MS
Valor esperado
MSA
MSB
MSAB
MSE
Por lo tanto, los estadsticos MSAB/MSE, MSA/MSE y MSB/MSE se distribuyen
como una F con los grados de libertad correspondientes y permiten contrastar,
respectivamente, las hiptesis:
i) no existe interaccin (MSAB/MSE)
ii) no existe efecto del primer factor, es decir, diferencias entre niveles del primer
factor (MSA/MSE)
Valor esperado
MSA
MSB
MSAB
MSE
donde
son, respectivamente las componentes aadidas por el
primer factor, por el segundo y por la interaccin, que tienen la misma forma que
los del modelo I, sin ms que cambiar i y j por Ai y Bj, respectivamente.
La interaccin se contrasta, como en el modelo I, con MSAB/MSE, si se rechaza
la hiptesis nula se contrastaran cada uno de los factores con MSA/MSAB y
MSB/MSAB.
En un modelo II, como no se est interesado en estimar los efectos de los
factores sino slo la existencia de la componente aadida, s tiene sentido
contrastar la existencia de la misma para cada factor incluso aunque exista
interaccin.
Aqu el problema se plantea cuando no se puede rechazar la hiptesis nula y se
concluye que no existe interaccin: entonces tanto MSE como MSAB estiman
2, entonces cul se elige para contrastar la componente aadida de los
factores?
En principio, parece razonable escoger su media (la media de varios
estimadores centrados es tambin un estimador centrado y ms eficiente), sin
embargo si se elige MSAB se independiza el contraste para los factores de un
posible error tipo II en el contraste para la interaccin. Hay autores que por ello
opinan que es mejor usar MSAB, pero otros proponen promediar si se puede
asegurar baja la probabilidad para el error tipo II. La media de los cuadrados
medios se calcula dividiendo la suma de las sumas de cuadrados por la suma
de los grados de libertad.
Ejemplo
A partir de la siguiente tabla de un anova de 2 factores modelo II, realizar los
contrastes adecuados.
Fuente de
variacin
G.L.
SS
MS
1 factor
315,8
78,95
2 factor
823,5
274,5
Interaccin
12
328,9
27,41
Error
100
2308,0
23,08
Total
119
3776,2
MS
Valor esperado
MSA
MSB
MSAB
MSE
Ejemplo
Ejemplo
Se quiere probar la eficacia de un somnfero estudiando posibles diferencias de
la misma por el sexo de los sujetos. Se eligen al azar dos grupos de insomnes
varones y otros dos de mujeres y tanto para los hombres como para las mujeres
se suministra a un grupo el somnfero y a otro un placebo y se mide, en minutos,
el tiempo que tardan en dormirse.
Los resultados son:
Placebo Somnfero
30
35
50
32
45
30
47
25
38
30
50
42
35
30
46
15
25
18
32
23
Hombre
Mujer
GL
SS
MS
Somnfero
696,2
696,2
Sexo
105,8
105,8
Interaccin
0,2
0,2
Error
16 1197,6
74,85
Total
19 1999,8
Ejemplo
sexo f = 105,8/74,85 = 1,41 que como es menor que 4,49 no existe diferencias
entre los sexos.
La estimacin del efecto del somnfero ser la diferencia entre las medias de los
que lo toman y los que tomaron placebo, sin tener en cuenta el sexo, una vez
que se ha visto que no tiene efecto.
Ejemplo
y la tabla de medias
Por tanto la estimacin del efecto del somnifero es 39,8 - 28,0=11,8 min
Ejemplo 3
En el ensayo clnico de los analgsicos descrito anteriormente se encuentran los
siguientes resultados:
Placebo
Analgsico A Analgsico B
35
20
22
40
35
42
60
50
30
50
40
35
50
30
22
G.L.
SS
MS
Analgsico
(tratamiento)
748,8
374,4
Paciente (bloque)
767,6
191,9
Error
409,2
51,15
Total
14
1925,6
y el resultado
Los tres primeros subndices para los factores y el cuarto para las repeticiones,
ntese que aparecen trminos de interaccin de segundo y tercer orden, en
general en un modelo de k factores aparecen trminos de interaccin de orden
2, 3,... hasta k y el nmero de trminos de interaccin de orden n ser el nmero
combinatorio Ck;n. Este gran nmero de trminos de interaccin dificulta el
anlisis de ms de dos factores, ya que son difciles de interpretar y complican
los valores esperados de los cuadrados medios por lo que tambin resulta difcil
encontrar los estadsticos para los contrastes. Por estas razones no se suele
emplear este tipo de anlisis y cuando interesa estudiar varios factores a la vez
se recurre a otros mtodos de anlisis multivariante.
en el caso continuo:
en el caso continuo:
discreta
continua
0,4
0,1
0,3
0,2
X2
f2(X2)
0,4
0,1
0,5
0,3
0,2
0,5
f1(X1)
0,7
0,3
0,4/0,5=0,8
0,1/0,5=0,2
Obsrvese que como esto es una fdp, la suma de sus valores debe ser 1.
0,8 es la probabilidad de que un individuo no sea hipertenso dado que no tiene
un consumo excesivo de sal.
Modelo lineal
Funcin lineal
Se llama funcin lineal de una
variable, a una funcin de la
forma
Modelo lineal
asumimos que para cada valor de X, Y no est determinada, sino que sigue una
distribucin normal cuya media est dada por el modelo:
Y (Presin)
1,8
100
2,2
98
3,5
110
4,0
110
4,3
112
5,0
120
Modelo lineal
se rechaza H0.
Para hacer estimacin por intervalos de la fuerza de la asociacin o el efecto
13,8
15,4
9,3
21,7
17,2
18,0
15,1
en nuestro caso mayor que 4,92. Como no lo es, no rechazamos H0. Hay que
calcular la probabilidad de encontrar
si 1 fuera 5. Calculamos
0 : media de Y cuando todas las Xi son cero (cuando no tiene sentido Xi=0, p.e.
edad, se interpreta como la media de Y que no depende de las Xi).
i : cambio en la media de Y cuando Xi aumenta una unidad permaneciendo
constantes las dems.
Las asunciones del modelo son una generalizacin de las de RLS y dado el
resultado de RLS no vamos a distinguir entre modelo I y II.
La estimacin de los coeficientes tambin se hace por mnimos cuadrados o
mxima verosimilitud y se obtienen los mismos resultados. Estos resultados,
usando notacin matricial, son (incluyen como caso particular la RLS):
es decir la matriz de datos con una primera columna de 1's. Estos coeficientes
http://www.hrc.es/bioest/Reglin_9.html (1 of 2) [28/12/2002 19:38:40]
se distribuyen como una normal multivariante cuya matriz de medias son los
verdaderos coeficientes y matriz de varianzas-covarianzas
un buen estimador de 2 es
Ejemplo 5
Dada una muestra hipottica de 20 pacientes en los que se ha recogido los
siguientes datos: nivel de colesterol en plasma sanguneo (en mg/100 ml), edad
(en aos), consumo de grasas saturadas (en gr/semana) y nivel de ejercicio
(cuantificado como 0: ningn ejercicio, 1: ejercicio moderado y 2: ejercicio
intenso), realizar el ajuste a un modelo lineal entre el nivel de colesterol y las
dems variables.
Tabla de datos
Paciente Colesterol Edad
Grasas Ejerci.
350
80
35
190
30
40
263
42
15
320
50
20
280
45
35
198
35
50
232
18
70
320
32
40
303
49
45
10
220
35
35
11
405
50
50
12
190
20
15
13
230
40
20
14
227
30
35
15
440
30
80
16
318
23
40
17
212
35
40
18
340
18
80
19
195
22
15
20
223
41
34
Obsrvese que, a diferencia de la RLS, este contraste no es equivalente al realizado sobre los
coeficientes.
Se define tambin el coeficiente de determinacin como el cociente entre la suma de
cuadrados de la regresin y la suma de cuadrados total (R2 = SSR/SST) y a su raz cuadrada
(R) se le denomina coeficiente de correlacin mltiple.
Adems de esta prueba global del modelo basada en el anlisis de la varianza, se pueden
plantear pruebas parciales sobre si una variable, o un grupo de variables, aadidas a un
modelo previo lo mejoran.
Se tiene un modelo
y se aade una nueva variable X*, con el primer modelo se tiene una SSR(Y,X1,...,Xk) y con el
nuevo otra SSR(Y,X1,...,Xk,X*), la diferencia entre ambas ser lo que ha mejorado la suma de
cuadrados por aadir la variable X* y tendr 1 grado de libertad.
SSR(Y,X*|X1,...,Xk) = SSR(Y,X1,...,Xk,X*) - SSR(Y,X1,...,Xk) = SSE(Y,X1,...,Xk) SSE(Y,X1,...,Xk,X*)
y el cociente
llamado F parcial, tendr una distribucin F con 1 y n-(k+2) grados de libertad en la hiptesis
http://www.hrc.es/bioest/Reglin_11.html (1 of 3) [28/12/2002 19:42:22]
se distribuye como una Fp,n-(k+p+1) en la hiptesis nula de que las nuevas p variables X1*, ...,
Xp* no mejoren el modelo con respecto a las k variables originales y permite contrastar dicha
hiptesis.
Ejemplo 6
Con los datos del ejemplo 5, realizar el contraste de la F parcial para aadir la variable ejercicio
a un modelo que slo contenga la edad y las grasas consumidas.
que se distribuye como una F1,16. Como F0,05(1,16) = 4,49 no se puede rechazar la hiptesis de
que EJERC no mejora el modelo. Obsrvese que esta Fpar es exactamente el cuadrado del
valor de t correspondiente al coeficiente de EJERC en el modelo con las tres variables
independientes.
VARIABLES "dummy"
X2
No-fumador
Fumador
Ex-fumador
VARIABLES "dummy"
X1
X2
X3
-1
-1
-1
El modelo quedar
y por lo tanto
Y = 0 - 1 - 2 - 3 = Y|A para los residentes en A
Y = 0 + 1 = Y|B para los residentes en B
Y = 0 + 2 = Y|C para los residentes en C
Y = 0 + 3 = Y|D para los residentes en D
si se suman las 4 ecuaciones:
0 = ( Y|A + Y|B + Y|C + Y|D)/4 por lo tanto
0 es la media de Y en los cuatro lugares de residencia
1 la diferencia de los residentes en B con respecto a la media
2 la diferencia de los residentes en C con respecto a la media y
3 la diferencia de los residentes en D con respecto a la media y, evidentemente, 1 - 2 - 3 la diferencia de los residentes en A con respecto a la media. De modo
que a diferencia del esquema anterior, se usa como nivel de referencia la media en
todas las categoras en lugar de una de ellas.
Otro posible esquema de codificacin que a veces se usa en la literatura es
X1
X2
X3
VARIABLES "dummy"
15,0
19,0
16,3
22,0
18,0
19,8
23,2
14,4
20,3
10
22,0
11
20,5
12
19,0
13
12,7
14
14,0
VARIABLES "dummy"
15
11,8
16
11,2
17
14,0
18
19,5
19
22,3
20
15,0
21
12,6
22
16,4
23
13,5
24
13,7
Los resultados de un modelo entre presin arterial y "status" de fumador tal y como
est codificado en la tabla son
VARIABLES "dummy"
PRE_AR
FUMADOR FUMA
EX_FUMA
15.0
19.0
16.3
22.0
18.0
19.8
23.2
14.4
20.3
10
22.0
11
20.5
12
19.0
13
12.7
14
14.0
15
11.8
16
11.2
17
14.0
18
19.5
19
22.3
20
15.0
21
12.6
22
16.4
23
13.5
VARIABLES "dummy"
24
13.7
VARIABLES "dummy"
Y = 0 + 1(x1 + 1) + 2 x2 + 3 (x1 + 1) x2 = 0 + 1 x1 + 1 + 2 x2 + 3 x1 x2
+ 3 x2
restando ambas se encuentra el cambio en Y por una unidad de cambio en X1
manteniendo fijo X2
1 + 3 x2
que es diferente para cada valor x2 de X2. Del mismo modo, el cambio en Y por
una unidad de cambio en X2 manteniendo fijo X1 es
2 + 3 x1
Por lo tanto, contrastar la existencia de interaccin entre X1 y X2 es contrastar si el
coeficiente 3 es cero (no hay interaccin), o distinto de cero (existe interaccin).
En caso de que exista interaccin los coeficientes 1 y 2 por s solos no
significan nada y la asociacin de las variables X1 y X2 con Y estar cuantificada
por las expresiones anteriores.
Es obvio que primero debe contrastarse la interaccin y despus, en caso de que
no exista, la confusin.
Ejemplo 8
En un trabajo para estudiar la relacin de la presin arterial sistlica con el
consumo de tabaco y caf, codificadas ambas como 0: no y 1: s, se han obtenido
los siguientes datos de una muestra aleatoria hipottica
Paciente Presin arte. Tabaco
Caf
15,0
11,0
26,3
13,0
18,0
19,8
23,2
14,4
13,3
10
12,0
11
22,5
12
23,5
13
12,7
14
14,0
15
11,8
16
21,2
17
14,0
18
15,5
19
12,3
20
15,0
21
22,6
22
16,4
23
23,5
24
13,7
Estrategias de modelizacin
Estrategias de modelizacin
El problema es cmo usamos todo esto? Debido a los dos objetivos distintos
que un anlisis de regresin puede tener es difcil establecer una estrategia
general para encontrar el mejor modelo de regresin, es ms, el mejor modelo
significa cosas distintas con cada objetivo.
En un anlisis predictivo el mejor modelo es el que produce predicciones ms
fiables para una nueva observacin, mientras que en un anlisis estimativo el
mejor modelo es el que produce estimaciones ms precisas para el coeficiente
de la variable de inters.
En ambos casos se prefiere el modelo ms sencillo posible (a este modo de
seleccionar modelos se le denomina parsimonia), de modo que en un anlisis
estimativo, se puede excluir del modelo una variable que tenga un coeficiente
significativamente distinto de cero y que su contribucin a la prediccin de la
variable dependiente sea importante, porque no sea variable de confusin para
la variable de inters (el coeficiente de dicha variable no cambia), en un anlisis
predictivo esa variable no se excluira.
Sin embargo, hay una serie de pasos que deben realizarse siempre:
i) Especificacin del modelo mximo.
ii) Especificacin de un criterio de comparacin de modelos y definicin de una
estrategia para realizarla.
iii) Evaluacin de la fiabilidad del modelo.
i) Especificacin del modelo mximo
Se trata de establecer todas las variables que van a ser consideradas.
Recurdese que el modelo saturado (el mximo que se puede considerar) tiene
n - 1 variables pero que, con este modelo, los grados de libertad para SSE son
cero, y R2=1, de modo que, en general, el modelo saturado no tiene inters y el
modelo mximo deber tener menos variables independientes que el modelo
saturado (un criterio habitual es incluir como mximo una variable cada 10
casos).
El criterio para decidir qu variables forman el modelo mximo lo establece el
investigador en funcin de sus objetivos y del conocimiento terico que tenga
sobre el problema, evidentemente cuanto menor sea el conocimiento previo
mayor tender a ser el modelo mximo.
Un modelo mximo grande minimiza la probabilidad de error tipo II o infraajuste,
que en un anlisis de regresin consiste en no considerar una variable que
realmente tiene un coeficiente de regresin distinto de cero.
Un modelo mximo pequeo minimiza la probabilidad de error tipo I o
sobreajuste (incluir en el modelo una variable independiente cuyo coeficiente de
regresin realmente sea cero).
http://www.hrc.es/bioest/Reglin_14.html (1 of 8) [28/12/2002 19:45:46]
Estrategias de modelizacin
Estrategias de modelizacin
Estrategias de modelizacin
Estrategias de modelizacin
Estrategias de modelizacin
Estrategias de modelizacin
Estrategias de modelizacin
El problema de la colinealidad
El problema de la colinealidad
Es uno de los problemas ms desesperantes con que uno se puede encontrar en un
anlisis de regresin. Como ya vimos al hablar de la estimacin de los coeficientes,
si en un modelo de RLM alguna variable independiente es combinacin lineal de
otras, el modelo es irresoluble, debido a que, en ese caso, la matriz X'X es singular,
es decir, su determinante es cero y no se puede invertir.
A este fenmeno se le denomina colinealidad. Que una variable X1 sea combinacin
lineal de otra X2, significa que ambas estn relacionadas por la expresin X1 = 1 +
2X2, siendo 1 y 2 constantes, por lo tanto el coeficiente de correlacin entre
ambas variables ser 1.
Del mismo modo, que una variable X1 sea combinacin lineal de otras X2, ..., Xi con
i>2, significa que dichas variables estn relacionadas por la expresin X1 = 1 +
2X2 + ... + iXi, siendo 1,..., i constantes y por tanto, el coeficiente de correlacin
mltiple RX1|X2,...Xi tambin ser 1.
Otro modo, por tanto, de definir la colinealidad es decir que existe colinealidad
cuando alguno de los coeficientes de correlacin simple o mltiple entre algunas de
las variables independientes es 1, es decir, cuando algunas variables
independientes estn correlacionadas entre s.
En la prctica, esta colinealidad exacta raras veces ocurre, pero s surge con cierta
frecuencia la llamada casi-colinealidad, o por extensin, simplemente colinealidad
en que alguna variable es "casi" combinacin lineal de otra u otras, o dicho de otro
modo, algunos coeficientes de correlacin simple o mltiple entre las variables
independientes estn cercanos a 1, aunque no llegan a dicho valor.
En este caso la matriz X'X es casi-singular, es decir su determinante no es cero
pero es muy pequeo. Como para invertir una matriz hay que dividir por su
determinante, en esta situacin surgen problemas de precisin en la estimacin de
los coeficientes, ya que los algoritmos de inversin de matrices pierden precisin al
tener que dividir por un nmero muy pequeo, siendo adems inestables.
Adems, como la matriz de varianzas de los estimadores es proporcional a X'X,
resulta que en presencia de colinealidad los errores estndar de los coeficientes son
grandes (hay imprecisin tambin en sentido estadstico).
Por consiguiente, a la hora de plantear modelos de RLM conviene estudiar
previamente la existencia de casi-colinealidad (la colinealidad exacta no es
necesario estudiarla previamente, ya que todos los algoritmos la detectan, de hecho
no pueden acabar la estimacin). Como medida de la misma hay varios estadsticos
propuestos, los ms sencillos son los coeficientes de determinacin de cada variable
independiente con todas las dems, es decir
El problema de la colinealidad
Una regla emprica, citada por Kleinbaum, consiste en considerar que existen
problemas de colinealidad si algn FIV es superior a 10, que corresponde a algn
R2i 0,9 y Ti < 0,1.
Aunque puede existir colinealidad con FIV bajos, adems puede haber
colinealidades que no impliquen a todas las variables independientes y que, por
tanto, no son bien detectadas por el FIV.
Otra manera, ms completa, de detectar colinealidad es realizar un anlisis de
componentes principales de las variables independientes. Esta tcnica es
matemticamente compleja y aqu se hace slo un resumen de la misma necesario
para entender el diagnstico de la colinealidad.
Se denominan componentes principales de un conjunto de variables a otras
variables, combinacin lineal de las originales y que tienen tres propiedades
caractersticas:
i) son mutuamente independientes (no estn correlacionadas entre s)
ii) mantienen la misma informacin que las variables originales
iii) tienen la mxima varianza posible con las limitaciones anteriores.
De hecho, para modelos predictivos los componentes principales son las variables
independientes ideales.
La varianza de cada componente principal es un autovalor (nmero asociado a una
matriz) de la matriz de varianzas-covarianzas de las variables originales.
El nmero de autovalores nulos indica el nmero de variables que son combinacin
lineal de otras (el nmero de colinealidades exactas) y autovalores prximos a cero
indican problemas graves de colinealidad.
El clculo de los autovalores permite, por lo tanto, determinar no slo la existencia
de colinealidad, sino tambin el nmero de colinealidades.
Para determinar cundo un autovalor pequeo est suficientemente prximo a cero
se usa su valor relativo con respecto al mayor, en este sentido, para cada autovalor
se define el ndice de condicin como la raz cuadrada del cociente entre el mayor
de ellos y dicho autovalor y se denomina nmero de condicin al mayor de los
ndices de condicin.
El problema de la colinealidad
Para Belsley ndices de condicin entre 5 y 10 estn asociados con una colinealidad
dbil, mientras que ndices de condicin entre 30 y 100 sealan una colinealidad
moderada a fuerte.
Una vez determinada la presencia y el nmero de colinealidades, es conveniente
averiguar qu variables estn implicadas en ellas. Usando ciertas propiedades de la
matrices se puede calcular la proporcin de la varianza de las variables sobre cada
componente.
Si dos o ms variables tienen una proporcin de varianza alta en un componente
indica que esas variables estn implicadas en la colinealidad y, por tanto, la
estimacin de sus coeficientes est degradada por la misma.
Belsley propone usar conjuntamente los ndices de condicin y la proporcin de
descomposicin de varianza para realizar el diagnstico de colinealidad, usando
como umbral de proporcin alta 0,5 de modo que, finalmente, dicho diagnstico se
har:
Los ndices de condicin altos (mayores que 30) indican el nmero de colinealidades
y la magnitud de los mismos mide su importancia relativa.
Si un componente tiene un ndice de condicin mayor que 30 y dos o ms variables
tienen un proporcin de varianza alta en el mismo, esas variables son colineales.
Como ya se indic ms arriba, la mejor solucin a los problemas de colinealidad
consiste en plantear el modelo de regresin con los componentes principales en
lugar de con las variables originales, si bien esta solucin slo est indicada en los
modelos predictivos.
En los modelos estimativos no tiene sentido, ya que el inters del modelo es,
justamente, estimar el efecto sobre la variable independiente de una variable
determinada y no interesa, por lo tanto, usar otras variables distintas.
Otras soluciones alternativas planteables en ambos tipos de modelos pueden ser:
cambios de escala en las variables, incluyendo el centrado de las mismas (restar a
cada variable su media) o, incluso, eliminar alguna de las variables colineales.
En este mismo sentido hay que tener en cuenta que las variables producto
introducidas para estudiar la interaccin pueden dan lugar a problemas de
colinealidad y no se recomienda, por lo tanto, que un modelo contenga muchos
trminos de interaccin.
Si una variable toma el mismo valor para todas las observaciones (tiene varianza
cero) existe colinealidad exacta con el trmino independiente, y si una variable tiene
varianza casi cero (toma valores muy prximos para todas las observaciones) existe
casi-colinealidad.
Puede ocurrir que una varianza pequea sea debida a una escala inapropiada para
la variable, por ejemplo, si la edad de sujetos adultos se mide en dcadas se obtiene
http://www.hrc.es/bioest/Reglin_15.html (3 of 6) [28/12/2002 19:46:44]
El problema de la colinealidad
una varianza 100 veces menor que si se midiera en aos. En este caso un cambio
de escala puede evitar el problema de la colinealidad.
Tambin se puede perder precisin en el clculo de (X'X)-1 por la existencia de
variables con varianzas excesivamente grandes, en cuyo caso el cambio de escala
aconsejable sera el contrario, por ejemplo, podra dar lugar a problemas de
precisin medir la edad en das.
Ejemplo 10
Realizar el estudio de colinealidad en los datos del ejemplo 5, usando los FIV, los
ndices de condicin y la matriz de proporcin de descomposicin de la varianza de
los estimadores.
Realizando los anlisis de regresin de cada una de las variables independientes
con todas las dems, se obtienen los siguientes coeficientes de determinacin,
tolerancia y factores de inflacin de la varianza
El problema de la colinealidad
Hay un ndice de condicin alto (50,781) y asociado con el mismo hay cinco
variables (el trmino constante, GRASAS, GRASA2, EDAD y GRAXED) con
proporcin de varianza alta.
Nos indica, por tanto, que GRASAS es colineal con GRASA2, GRAXED (no nos
sorprende), EDAD y con la constante.
Al existir esta ltima colinealidad, el centrado de variables podra mejorar el
problema, se podra tambin renunciar a estudiar los trminos no lineales GRASA2
y GRAXED.
Empecemos por centrar las variables continuas.
GRASAC = GRASAS - 39,7
EDADC = EDAD - 36,25
GRASC2 = GRASAC x GRASAC
GRXEDC = GRASAC x EDADC
GRXEJC = GRASAC x EJERC
y, para ellas, el diagnstico de colinealidad queda:
El problema de la colinealidad
denominados residuos, son los valores que en la muestra toman estas variables.
Generalmente, sin embargo, no se tienen suficientes de estos valores muestrales para
cada variable (para el problema del ejemplo 5, por ejemplo, existe una variable x1,...,xk
para cada valor de la edad, del consumo de grasas y del ejercicio; el residuo para el primer
paciente corresponde a la variable 80,35,0; el del segundo a la variable 30,40,2; etc., es
http://www.hrc.es/bioest/Reglin_16.html (1 of 3) [28/12/2002 19:47:24]
llamada residuo normalizado tendr una distribucin t de Student con (n-(k+1)) grados de
libertad, que para valores de n suficientemente grandes se puede aproximar a una normal
reducida (de media cero y varianza 1) y, a menudo, se contrasta la distribucin de esta
variable en lugar de el residuo.
Adems de estas pruebas de significacin para asegurar que globalmente se cumplen las
asunciones del modelo, es til realizar un anlisis grfico de los mismos que permite
discriminar entre distintas violaciones de las mismas. Si se representara en una grfica
bidimensional los residuos observados (eje Y) para cada una de las variables Y|x1,...,xk (eje
X) y se cumplieran las asunciones se observara una nube de puntos en direccin
horizontal y con anchura constante (la media de cada x1,...,xk debera ser cero y tener
todas la misma varianza). Como para cada variable Y|x1,...,xk el modelo produce la misma
estimacin una grfica de los residuos contra los valores predichos tendr el mismo
aspecto (fig. A).
Si se viola la linealidad se observar una falta de linealidad tambin en los residuos (fig. B),
si se viola la homoscedasticidad, la anchura de la banda no ser constante (fig. C), una
relacin lineal entre los residuos y las predicciones puede indicar que alguna variable no
incluida en el modelo puede ser significativa (fig. D).
Intro_errores
Intro_errores
Esquemticamente
Precisin o
concordancia intraobservador
reproducibilidad o
concordancia interobservador
concordancia
exactitud
Validez
conformidad
Referencias
Feinstein A.R. (1987) Clinimetrics. Yale University Press. New Haven.
Indices de concordancia
ndices de concordancia
Caso ms sencillo: 2 observadores y variable dicotmica.
Ejemplo: dos radilogos independientes informan como neumona s/no 100 radiografas. Los
resultados son
Radilogo A
Rad. B
Pulmona
No pulmona
Total
Pulm.
10
No
10
80
90
Total
14
86
100
En general
Observador A
Obs. B
Positivo
Negativo
Total
Positivo
Negativo
Total
Indices de concordancia
para calcular Pe hay recordar que dos sucesos A1, A2 son independientes si p(A1
A2)=p(A1)p(A2). En este caso, si llamamos A1 al suceso "el observador A clasifica un individuo
como positivo" y A2 al suceso "el observador B clasifica un individuo como positivo" el suceso
A1 A2 ser "ambos observadores clasifican un individuo como positivo"; como el observador
A ha clasificado t individuos como positivos y el B ha clasificado r, la mejor estimacin de p(A1)
es t/N y la de p(A2) es r/N, por lo tanto la mejor estimacin de la probabilidad de que ambos
clasifiquen como positivo a un individuo, en la hiptesis de que ambos son independientes es
su producto, es decir rt/N2; por la misma razn, la probabilidad de que ambos clasifiquen como
negativo a un individuo por azar es su/N2, en consecuencia
Cuando hay acuerdo total b=c=0, por lo tanto el valor de Po es 1 y en consecuencia el ndice
tambin vale 1 para el mximo acuerdo; si el acuerdo observado es igual al esperado por azar,
vale 0. Obsrvese que si el acuerdo observado es menor que el esperado por azar, el ndice
toma valores negativos. Un modo intuitivo de interpretar este ndice puede hacerse
despejando Po de la definicin
es decir, ambos radilogos coinciden en un 84% de las radiografas. Ahora bien, el acuerdo
esperado por azar es
por lo tanto
Indices de concordancia
es decir, el grado de acuerdo una vez corregido el debido al azar es mucho ms modesto que
lo que indicaba el 84% de acuerdo "crudo". Segn la interpretacin anterior, el acuerdo
observado est compuesto por un 24,5% del acuerdo mximo y un 75,5% del esperado por
azar.
Landis y Koch propusieron, y desde entonces ha sido ampliamente usada, la siguiente escala
de valoracin del
kappa
grado de acuerdo
< 0,00
sin acuerdo
0,00 - 0,20
insignificante
0,21 - 0,40
discreto
0,41 - 0,60
moderado
0,61 - 0,80
sustancial
0,81 - 1,00
casi perfecto
Referencias
Cohen J. (1960) A coefficient of agreement for nominal scales. Educ Psychol Meas 20:37-46.
Landis J.R., Koch G.G. (1977) The measurement of observer agreement for categorical data.
Biometrics 33:159-174.
Latour J., Abraira V., Cabello J.B., Lpez Snchez J. (1997) Mtodos de investigacin en
cardiologa clnica (IV). Las mediciones clnicas en cardiologa: validez y errores de medicin.
Rev Esp Cardiol 50:117-128.
Rad. A
Rad. B
30
10
54
36
40
donde las prevalencias respectivas son 40% para A y 36% para B, con la misma proporcin de
acuerdos observados (84%) el ndice hubiera sido 0,661. En general, cuanto ms cercana a 0,5
sea la prevalencia (cuanto ms balanceados estn los totales marginales en la tabla) mayor es el
para igual proporcin de acuerdos observados, dicho de otro modo, prevalencias muy bajas, o
muy altas, penalizan el ndice , debido a que en ese caso la proporcin de acuerdos esperados
por azar es mayor que cuando la prevalencia es cercana a 0,5. Por otro lado, ste tambin se ve
afectado por la simetra de los totales marginales.
Considerese, por ejemplo, las tablas
Rad. B
Tabla 1
Tabla 2
Rad. A
Rad. A
45
15
25
15
60
70
25
35
35
60
30
En consecuencia, para interpretar el ndice es necesario contar, tambin con el valor de las
frecuencias marginales de la tabla (prevalencias observadas por cada observador).
El pequeo valor de para los datos del ejemplo (mediano en la escala de Landis y Koch) es
"explicado" a la luz de los efectos anteriores por el hecho de que estamos en la peor de las
situaciones posibles: baja prevalencia, y similar, en ambos observadores o, en la terminologa
anterior totales marginales "desbalanceados" con casi perfecta simetra.
Referencias
Feinstein A.R., Cicchetti D.V. (1990) High agreement but low kappa: I. The problem of two
paradoxes, J Clin Epidemiol 43: 543-549.
Clasificaciones multinomiales
Clasificaciones multinomiales
Si bien las clasificaciones binomiales son muy frecuentes, a menudo en clnica resultan insuficientes. P.e. un
psiquiatra clasifica los trastornos de los pacientes en psicticos, neurticos u orgnicos, o un reumatlogo clasifica
las artritis en leves, moderadas o graves. Ambas clasificaciones son multinomiales (tres categoras), no obstante
existe una diferencia entre ellas, las categoras en el caso de la artritis pueden ordenarse de un modo relevante para
el problema: una artritis grave es ms que una moderada, y sta ms que una leve, mientras que para la
clasificacin psiquitrica este orden no existe. A las variables multinomiales que tienen implcito un orden se les
denomina ordinales y a las que no, nominales. Para estudiar la precisin de una clasificacin multinomial, hay ciertas
diferencias segn que sta sea ordinal o nominal.
Como en las clasificaciones binarias, los resultados de un estudio de concordancia se pueden resumir en una tabla
de doble entrada, aunque ahora con K filas y K columnas, siendo K el nmero de categoras de la clasificacin.
La notacin usada en esta tabla es: para identificar una celda se usan dos subndices: el primero para la fila y el
segundo para la columna, por lo tanto Xij es el nmero de individuos que el observador B ha clasificado en la
categora i y el observador A en la j.
Observador A
Obs. B
Cat. 1
Cat. 2
...
Cat. K
Total
Cat. 1
X11
X12
...
X1K
X1.
Cat. 2
X21
X22
...
X2K
X2.
...
Cat. K
XK1
XK2
...
XKK
XK.
Total
X.1
X.2
...
X.K
Para indicar los totales marginales se usa un punto en el lugar del subndice con respecto al que se ha sumado: Xi.
es la suma de la fila i y X.j es la suma de la columna j. En notacin algebraica
Para una clasificacin multinomial se puede definir un ndice kappa idntico al anterior, generalizando el clculo de
Po y Pe como
Ejemplo: Dos reumatlogos clasifican en tres categoras (leve, moderada, grave) 80 enfermos con artritis. Los
resultados son
Reumatlogo A
Reum. B
Leve
Mode.
Grave
Leve
20
Moderada
29
43
Total
Clasificaciones multinomiales
Grave
14
17
Total
18
40
22
80
Otra alternativa para estudiar concordancia entre clasificaciones multinomiales consiste en definir un ndice kappa
para cada una de las categoras, colapsando la tabla KxK original en K tablas 2x2 en las que se compara cada
categora con todas las dems. De este modo se puede estudiar la contribucin de cada una de ellas a la
concordancia de la clasificacin.
Para los datos del ejemplo, se colapsara la tabla en 3 tablas: una comparando la categora leve con las dems, otra
la moderada con las dems y la tercera la grave con las otras.
Obs B
Obs A
Obs A
Obs A
11
51
29
14
11
26
14
55
Po
Pe
0,75
0,638
0,309
0,688
0,5
0,376
0,863
0,629
0,631
tabla
donde se observa que la clasificacin de la categora grave es la que mayor produce (Cmo se interpreta?).
Peso
lineal (wl)
bicuadrado (wb)
Obs.
Cat
1/2
3/4
1/2
1/2
3/4
3/4
1/2
3/4
Para los datos del ejemplo de los reumatlogos los kappas usando estos sistemas de pesos
son respectivamente
Mltiples observadores
Este ndice se puede extender a mltiples observadores, con lo que las frmulas se complican
pero sin apenas cambios conceptuales.
Referencias
Cohen J. (1968) Weighted kappa: Nominal scale agreement with provision for scaled
disagreement or parcial credit Psychol Bull 70: 213-220.
por lo tanto
siendo
Tambin hay frmulas, que os ahorro, para la varianza del kappa ponderado. Para el caso de
mltiples observadores, aunque hay algunas aproximaciones parciales, no existe todava una
frmula de uso general para la estimacin de su varianza, y se suele usar una tcnica muy
general para construir intervalos de confianza para estadsticos de distribucin muestral
desconocida que es la denominada "tcnica jackknife", introducida por Quenouille y que se
puede aplicar al ndice kappa.
Referencias
Abraira V., Prez de Vargas A. (1999). Generalization of the kappa coefficient for ordinal
categorical data, multiple observers and incomplete designs. Qestii 23: 561-571
494
512
-18
503.0
395
430
-35
412.5
516
520
-4
518.0
434
428
431.0
476
500
-24
488.0
557
600
-43
578.5
413
364
49
388.5
442
380
62
411.0
650
658
-8
654.0
10
433
445
-12
439.0
11
417
432
-15
424.5
12
656
626
30
641.0
13
267
260
263.5
14
478
477
477.5
15
178
259
-81
218.5
16
423
350
73
386.5
17
427
451
-24
439.0
23-MAR-1995
REGRESION LINEAL
X = wright MWRIGH
Y = wright WRIGHT
NO. DE PUNTOS
17
COEF. CORRELACION
.943
COEF. DETERMINACION
.890
39.882
Ecuacin de la recta
Y = .970 X + 11.482
donde se observa que las mediciones no son tan concordantes como pareca en la grfica anterior.
La media de las diferencias es de -2.1 l/min, es decir hay un error sistemtico "hacia abajo" por parte del
miniWright. Los lmites de concordancia son los lmites de confianza de esta diferencia, para calcularlos se calcula
la desviacin tpica de la diferencia, en este caso 38,8 y como t17 =2,11, los lmites de concordancia son 79,3 y 83,5, es decir con un 95% de probabilidad la medicin del miniWright puede ser 83,5 por debajo o 79,3 por arriba
de la media de ambas es esto aceptable clnicamente?
Notar que en la grfica, las diferencias se mantienen homogneas a lo largo del eje X. Si no fuera as, este mtodo
no se puede usar.
Puesto que estamos trabajando con una muestra, se deben tambin calcular los lmites de confianza para dichos
Latour J., Abraira V., Cabello J.B., Lpez Snchez J. (1997) Mtodos de investigacin en cardiologa clnica (IV).
Las mediciones clnicas en cardiologa: validez y errores de medicin. Rev Esp Cardiol 50:117-128.
ndices de validez
ndices de validez
Se trata, en esta clase, de procedimientos para evaluar la validez, es decir cunto se aproxima
una medida al valor real que pretende medir. Son procedimientos muy generales, pero aqu se
van a tratar al hilo del problema de las pruebas diagnsticas (problema muy importante en la
prctica y la investigacin clnica): pruebas para determinar si un individuo tiene, o no, una
cierta enfermedad (u otra caracterstica). Hay que resaltar (y no siempre se hace) que si bien
la validez de una prueba depende exclusivamente de la prueba, las estimaciones numricas
que se obtengan de la misma pueden depender de la prevalencia y de las caractersticas
clnicas de los pacientes que se hayan estudiado.
Empezemos por el caso ms sencillo: una prueba cuyos resultados posibles son "positivo" o
"negativo". Para evaluar su validez habr que aplicarla a una muestra de individuos que
sepamos que tienen la enfermedad y a otra que sepamos que no la tiene. Los resultados se
pueden expresar en una tabla como la siguiente:
Estado
Prueba
No Enfer.
Enfermo
Total
Negativo
Positivo
Total
ndices de validez
(datos tomados de McNeil). Uno de los problemas de estos estudios es la definicin del "gold
standard". En ste, se us la arteriografa pulmonar
Estado
Prueba
No Enfermo
Enfermo
Total
Negativo
Positivo
78
54
132
Total
80
54
134
Ejemplo: Calcular los VP+ y VP- de la gammagrafa de perfusin para un paciente cuya
probabilidad preprueba es de 0,7
ndices de validez
sin embargo, si da negativa estamos seguros de que no tiene la enfermedad (porque la prueba
tiene Sen=1). Observar que el VP- es igual que el calculado antes para una probabilidad
preprueba de 0,4 sin embargo el VP+ es distinto.
Referencias
Cabello J.B., Pozo F. (1997) Mtodos de investigacin en cardiologa clnica (X). Estudios de
evaluacin de las pruebas diagnsticas en cardiologa. Rev Esp Cardiol 50:507-519.
McNeil B.J. (1980) Ventilation-perfusion studies and the diagnosis of pulmonary embolism:
concise communication. J Nucl Med. 21: 319-23.
Cocientes de probabilidades
Cocientes de probabilidades:
Se trata de buscar ndices que engloben la sensibilidad y la especificidad. Se definen los
cocientes de probabilidades (likelihood ratio) positivo y negativo como:
Similarmente:
es decir: un resultado positivo apenas aade informacin, mientras que uno negativo da toda
la informacin (si el resultado es negativo, la odds postprueba es 0, la probabilidad postprueba
es 0) Cul sera la probabilidad postprueba de un paciente con una probabilidad prepueba de
http://www.hrc.es/bioest/validez_2.html (1 of 2) [01/01/2003 23:25:48]
Cocientes de probabilidades
No hemos ganado prcticamente nada, como informa el valor de CP+ tan prximo a 1.
Ventajas de usar los CP:
- No cambian con la probabilidad preprueba.
- Permiten calcular la probabilidad postprueba.
- Son fcilmente generalizables.
Ultimamente se ha descrito otro ndice denominado efectividad de la prueba, cuya distribucin
es aproximadamente normal, que se define como
y que puede interpretarse como la diferencia entre las medias de los resultados entre una
poblacin de enfermos y otra de sanos en una escala normalizada. Si =1 la prueba no es
efectiva y si =3 es altamente efectiva.
Referencias
Hasselband V., Hedges L. (1995). Meta-analysis of diagnostics test. Psychol Bull 117: 167-178
siendo a, b, c y d los valores de las celdas de la tabla anterior. Obsrvese que para CP=0 el
intervalo de confianza es siempre 0.
Tablas Kx2
Tablas Kx2
Los ndices calculados sobre tablas 2x2 tienen la ventaja de su sencillez, sin embargo,
raramente una prueba diagnstica se puede resumir en slo dos resultados. Por ejemplo, los
datos originales del ejemplo de la gammagrafa son:
Enfermo
Prueba
No
Total
Negativo
Indeter.
22
13
35
pulmonar
lobular
segmentario
subsegmentario
pulmonar
lobular
22
27
segmetario
16
22
38
subsegmentario
41
44
102
67
169
Defecto nico
Defectos
mltiples (el
mayor)
Total
En la tabla presentada antes se haban eliminado los indeterminados (35 casos) y se haban
agrupado todos los defectos de perfusin en la categora "positivo", lo que parece una
simplificacin excesiva.
Se pueden extender, sin dificultad, los ndices anteriores a pruebas con varios niveles. Sea,
p.e, una tabla 4x2
Enfermo
Prueba
No
Nivel 1
Tablas Kx2
Nivel 2
Nivel 3
Nivel 4
Total
Se puede definir una sensibilidad para cada nivel como la probabilidad de que la prueba
resulte en ese nivel condicionada a que el individuo est enfermo, y especificidad para cada
nivel como la probabilidad de que la prueba no resulte en ese nivel condicionada a que el
individuo no est enfermo. A partir de la tabla, la estimaciones de la sensibilidad y
especificidad, p.e. para el nivel 2 son
se define tambin el cociente de probabilidades para cada nivel como la sensibilidad de ese
nivel dividido por uno menos la especificidad, p.e. para el nivel
estos CP se interpretan del mismo modo, es decir el odds postprueba es el odds preprueba
multiplicado por el CP del nivel que resulte y los IC se calculan de la misma manera.
Ejemplo: Para la gammagrafa, agrupando en 4 categoras, calcular la sensibilidad,
especificidad y cociente de probabilidades para cada nivel. Calcular, tambin, la probabilidad
postprueba para cada uno de los niveles de un paciente cuya probabilidad preprueba sea 0,6.
Enfermo
Prueba
No
Total
Negativo
Indeterminado
22
13
35
Defecto nico
14
18
Defectos mltiples
64
50
114
Total
102
67
169
Tablas Kx2
Nivel
Sen
Esp
CP
0/67 = 0
100/102 = 0,980
Indeterminado
13/67 = 0,194
80/102 = 0,784
0,900
Defecto nico
4/67 = 0,060
88/102 = 0,863
0,435
Defectos mltiples
50/67 = 0,746
38/102 = 0,373
1,189
Negativo
Para un paciente con una probabilidad preprueba de 0,6, el odds preprueba es 0,6/0,4=1,5.
Nivel
Oddspos
ppos
Indeterminado
1,347
0,574
Defecto nico
0,655
0,396
Defectos mltiples
1,784
0,641
Negativo
Es decir, dentro de los resultados "positivo" de antes, el defecto nico es el de mayor poder
informativo.
Ejemplo: Calcular los IC al 95% para los ndices anteriores.
Para la sensibilidad y especificidad usamos la frmula estndar, aunque para el resultado
negativo estamos fuera de las condiciones de aproximacin, por ejemplo para Espneg
Nivel
Sen
Esp
Negativo
0-0
0,953 - 1,007
Indeterminado
0,099 - 0,289
0,704 - 0,864
Defecto nico
0,003 - 0,117
0,796 - 0,930
Tablas Kx2
Defectos mltiples
0,642 - 0,850
0,279 - 0,466
Nivel
Negativo
IC
0-0
Indeterminado
0,487 - 1,657
Defecto nico
0,150 - 1,265
Defectos mltiples
0,969 - 1,459
Ms de dos enfermedades
Ms de dos enfermedades
Estos ndices se pueden generalizar a pruebas diagnsticas diferenciales de ms de 2
enfermedades. Ejemplo: el tacto rectal en caso de dolor abdominal agudo para diferenciar
entre apendicitis, pancreatitis y dolor no especfico. Sea la tabla
Desenlace
Tacto rectal
Apendicitis
Pancreatitis
No especfico
Total
Positivo
200
130
338
Negativo
60
30
120
210
Dudoso
40
12
400
452
Total
300
50
650
1000
Ejemplo 5 Con los CP del tacto rectal obtenidos de la tabla anterior, calcular la probabilidad
postprueba de apendicitis para un individuo con tacto rectal positivo y cuyas probabilidades
preprueba son: p(A)=0,30; p(P)=0,05 y p(NE)=0,65
Necesitamos estimar, a partir de la tabla, las sensibilidades de cada enfermedad para el tacto
http://www.hrc.es/bioest/validez_5.html (1 of 2) [01/01/2003 23:29:05]
Ms de dos enfermedades
rectal positivo
por lo tanto
es decir, si el tacto rectal es positivo, hemos pasado de una probabilidad preprueba de 0,30 a
una probabilidad postprueba de 0,59.
El clculo de los IC para estas probabilidades escapa del objetivo de este curso, pero se
pueden ver en Monsour M.J.; Evans A.T, Kupper L.L. (1991).
Referencias
Birkett N.J. (1988) Evaluation of diagnostic tests with multiple diagnostic categories. J Clin
Epidemiol 41:491-494
Monsour M.J., Evans A.T., Kupper L.L. (1991) Confidence intervals for post-test probability.
Stat Med (1991), 10: 443-456.
ENFER
GAMMA
0:0
1:1
2( 2)
0( 0)
1:1
22( 22)
13( 19)
2:2
14( 14)
4( 6)
3:3
64( 63)
50( 75)
4:4
Nivel
Sensibilidad
Especif.
CP
.000
.980
.000
.194
.784
.900
.060
.863
.435
.746
.373
1.189
Sensibilidad
Especif.
CP
.000
.054
.931
.995
.000
.000
.117
.304
.704
.864
.488
1.660
.023
.144
.796
.930
.150
1.265
.631
.835
.279
.466
.969
1.459
Probabilidad
.0000
.2783
.1571
.3376
Nota: Las diferencias entre las estimaciones de los IC para la Sensibilidad y Especificidad de esta
"salida" y del texto anterior son debidas a que en el texto se us la aproximacin normal y el PRESTA
no la usa si N<100 y los ndices <0,05 >0,95 en cuyo caso usa la aproximacin de Wilxon.
Curvas ROC
Curvas ROC
En la clase anterior se consider que el resultado de las pruebas diagnsticas era categrico,
sin embargo muchas pruebas producen resultados continuos, p.e. nivel de glucosa en sangre
para diagnosticar la diabetes. El comportamiento de dichas pruebas depende de donde se
ponga el punto de corte y lo habitual es que exista un grado variable de solapamiento en la fdp
de la variable resultado. En el caso de la glucosa la situacin se esquematiza en la grfica
Curvas ROC
Un parmetro para evaluar la bondad de la prueba es el rea bajo la curva que tomar valores
entre 1 (prueba perfecta) y 0,5 (prueba intil). Puede demostrarse, (Hanley y McNeil) que este
rea puede interpretarse como la probabilidad de que ante un par de individuos, uno enfermo y
el otro sano, la prueba los clasifique correctamente.
En consecuencia, las curvas ROC son tiles para:
Conocer el rendimiento global de una prueba. Area bajo la curva.
Comparar dos pruebas o dos puntos de corte. Comparacin de dos curvas o de dos puntos
sobre una curva.
Elegir el punto de corte apropiado para un determinado paciente.
Limitaciones de su uso: slo contemplan dos estados clnicos posibles (sano, enfermo) y no
sirven para situaciones en que se trata de discernir entre ms de dos enfermedades.
Ejemplo: Evaluacin del volmen corpuscular medio (VCM) en el diagnstico de anemia
ferropnica. Se usa como "patrn de oro" la existencia de depsitos de hierro en la mdula
sea
Tabla de datos (hipottica):
VCM
Sin Fe (n=34): 52, 58, 62, 65, 67, 68, 69, 71, 72, 72, 73, 73, 74, 75, 76, 77, 77, 78, 79, 80, 80,
81, 81, 81, 82, 83, 84, 85, 85, 86, 88, 88, 90, 92
Con Fe (n=66): 60, 66, 68, 69, 71, 71, 73, 74, 74, 74, 76, 77, 77, 77, 77, 78, 78, 79, 79, 80, 80,
81, 81, 81, 82, 82, 83, 83, 83, 83, 83, 83, 83, 84, 84, 84, 84, 85, 85, 86, 86, 86, 87, 88, 88, 88,
89, 89, 89, 90, 90, 91, 91, 92, 93, 93, 93, 94, 94, 94, 94, 96, 97, 98, 100, 103
Curvas ROC
Donde se observa solapamiento. Para diversos puntos de corte (es decir, decidiendo que hay
anemia cuando el VCM es menor que el punto de corte) las sensibilidad y proporciones de
falsos positivos figuran en la siguiente tabla:
Punto Corte
Sensibilidad
1-Especificidad
65
3/34=0,088
1/66=0,015
70
7/34=0,206
4/66=0,061
75
13/34=0,382
10/66=0,152
80
19/34=0,559
19/66=0,288
85
27/34=0,794
37/66=0,561
90
32/34=0,941
49/66=0,742
92
33/34=0,971
53/66=0,803
Curvas ROC
cuya rea es 0,717 con un EE de 0,05, es decir no es una prueba demasiado buena. Si se
quisiera comparar esta prueba con otra, p.e. niveles sricos de ferritina, se contruira para ella
otra curva y se calculara su rea. Supongamos A=0,868 y EE(A)=0,04. El estadstico para
compararlas es (si ambas curvas han sido estimadas independientemente, es decir con
distintos sujetos, en caso contrario, vase Hanley J.A., McNeil B.J. (1983)):
que en este ejemplo vale 2,34 que como es mayor que 1,96 ambas pruebas tienen un
rendimiento significativamente distinto.
Referencias
Hanley J.A., McNeil B.J. (1982) The meaning and use of the area under a receiver operating
characteristic (ROC) curve. Radiology. 143: 29-36
Hanley J.A., McNeil B.J. (1983) A method of comparing the areas under receiver operating
characteristic curves derived from the same cases. Radiology. 148: 839-43
Representamos por U la utilidad y es un valor normalizado (ver ejemplo) que depender de las consecuencias de
la decisin y de las preferencias del paciente. La utilidad esperada de la prueba es el promedio ponderado, por las
respectivas probabilidades, de las diferentes utilidades es decir
. El resultado es
El primer miembro de la igualdad es la pendiente de la curva ROC. La ecuacin nos da un criterio para elegir el
punto de corte: de tal modo que la pendiente en l sea la de la expresin. UVN-UFP es la diferencia en beneficio
entre no tratar a VN y tratar FP. Habitualmente se denomina coste neto (C) de tratar pacientes no enfermos. UVPUFN es la diferencia en beneficio entre tratar a VP y no tratar FN. Habitualmente se denomina beneficio neto (B)
de tratar sujetos enfermos. Con estas consideraciones la frmula anterior se puede escribir como
Ejemplo: calcular las pendientes del polgono ROC del ejemplo del VCM.
La pendiente en el primer tramo es 0,088/0,015=5,87; en el segundo tramo (0,206-0,088)/(0,061-0,015)=2,57; por
tanto la pendiente para el primer punto es (5,87+2,57)/2=4,22. Repitiendo el mismo clculo para todos los puntos
resulta:
Punto Corte
Pendiente
65
4,22
70
2,25
75
1,62
80
1,08
85
0,84
90
0,65
92
0,32
Ejemplo: Usando la tabla anterior, decidir el punto de corte ptimo para un paciente con probabilidad preprueba de
0,3 y otro de 0,6.
Hay que establecer tambin las utilidades:
UVP: El paciente tiene la enfermedad y la prueba lo detecta. Asumiendo que la anemia ferropnica tenga un
tratamiento eficaz y seguro le ponemos 1 (el mximo, si no hubiera tratamiento le pondramos 0, incluso negativo
si al paciente le causara angustia un diagnstico fatal).
UFN: El paciente tiene la enfermedad y la prueba no lo detecta. Las consecuencias seran otras pruebas, que
implican gasto y retraso en el verdadero diagnstico (asumo que pasado un tiempo de no mejora se replanteara
el problema) UFN=-0,3.
Es decir el beneficio neto B=1-(-0,3)=1,3
UVN: El paciente no tiene la enfermedad y la prueba no la detecta. Asumiendo que la anemia no ferropnica
tenga tratamiento menos eficaz y menos seguro le ponemos 0,7.
UFP: El paciente no tiene la enfermedad pero la prueba la detecta. Las consecuencias seran tratamiento
inadecuado (anemia ferropnica) pero sin efectos adversos, que implica gasto y retraso en el verdadero
diagnstico (asumo que pasado un tiempo de no mejora se replanteara el problema) UFN=-0,5. Si el tratamiento
tuviera efectos adversos podra ser -0,8 o menos.
Arterio
gam.
Sen
1-Esp
Pendiente
alta
102
14
0,41
0,03
7,29
inter
207
231
0,82
0,48
0,65
baja
246
430
0,98
0,90
0,38
norm
251
480
P(E)
1/odds
C/B
Pendiente
Nivel
0,34
1,92
0,5
0,96
inter
0,34
1,92
3,84
0,15
5,67
0,5
2,84
0,15
5,67
11,34
>alta
tratamiento. B
(X=0)
curacin
18
13
no
Total
20
20
el odds para la moneda es 5 veces el odds del dado, es decir, a la larga la razn
de partidas ganadas/perdidas es 5 veces mayor para la moneda que para el
dado. Para decidir a que juego interesa jugar hay que comparar este odds ratio
con la razn de los cocientes entre lo que se puede ganar y perder en cada
jugada en ambos juegos. El OR est siempre ms alejado de 1 que el RR,
aunque cuando las probabilidades son muy pequeas la diferencia (entre el OR
y el RR) es pequea.
Se trata, ahora, de comparar el juego de la lotera nacional (X=1) en el que el
premio es para un nmero extrado de entre 100.000, con el de la lotera
primitiva (X=0) en que se premia una combinacin de 6 nmeros de entre las
que se pueden formar con 49 nmeros. Resulta p|(X=1)=1/100.000. El nmero
de combinaciones de 6 nmeros que se pueden formar con 49 es
C49;6=13.983.816 por lo tanto p|(X=0)=1/13.983.816 y:
que, como era de esperar, debido a los pequeos valores de p|X=1 y p|X=0 es
prcticamente igual que el riesgo relativo (recordar cuando la prevalencia es
baja, el OR estima el RR).
Otras lecturas recomendadas
1 Odds ratios should be avoided when events are common. Altman DG et al.
BMJ. 317:1318. 1998
2 When can odds ratios mislead? Davies HTO et al. BMJ. 316:989-991. 1998
3 Medidas del efecto de un tratamiento (I): reduccin absoluta del riesgo,
reduccin relativa del riesgo y riesgo relativo. Abraira V. SEMERGEN 26: 535536. 2000.
4 Medidas del efecto de un tratamiento (II): odds ratio y nmero necesario para
tratar. Abraira V. SEMERGEN 27: 418-420. 2001.
por lo tanto:
es decir 1 es el logaritmo del cociente de los odds para los dos valores de la
variable X, u "odds ratio" (OR), Si la variable binomial es independiente de la
variable X, ambos odds son iguales, por lo tanto el odds ratio es 1 y su logaritmo
ser cero. Por lo tanto, para estudiar con un modelo logstico la independencia
de las variables, basta con estudiar si el coeficiente 1 es cero.
En el caso que se est considerando de una variable independiente con slo
dos valores, el riesgo relativo se puede poner, usando las otras formas del
modelo:
con contacto
(X=1)
enfermos
no enfermos
A partir de esta tabla no se pueden estimar p|X=0 ni p|X=1 ya que los datos para
X=0 y X=1 no provienen de una nica muestra. Dado que se ha muestreado
independientemente en enfermos y no enfermos, las probabilidades que s se
pueden estimar a partir de la tabla son p(X=0|E), p(X=0|nE), p(X=1|E) y
p(X=1|nE) cuyos estimadores son respectivamente A/(A+B), C/(C+D), B/(A+B) y
D/(C+D).
Para calcular a partir de ellos p(E|X=0), p(nE|X=0), p(E|X=1) y p(nE|X=1),
aplicando el teorema de Bayes, sera necesario conocer p(E) y p(nE), para las
que la tabla no ofrece ningn estimador, por consiguiente no se puede estimar el
odds para X=0 ni para X=1. S se puede, sin embargo, (aplicando el teorema de
Bayes) estimar el odds ratio y se obtiene:
Intervalos y contrastes
Hay que tener en cuenta que los estimadores habituales de la asociacin no son
los coeficientes i sino los odds ratio, por lo tanto los intervalos de confianza que
interesan calcular son los de los odds ratio. Evidentemente dichos intervalos
estn dados por:
que se distribuye como una ji-cuadrado con 1 grado de libertad y, por tanto, la
regin crtica para el contraste es
contrastes de Wald.
Intervalos y contrastes
Curacin
Tratamiento
13 casos
7 casos
18 casos
2 casos
Intervalos y contrastes
Muertes
El estimador del odds para la dosis 0 (es decir del cociente de la probabilidad de
que un animal muera y la probabilidad de que no muera, en el tiempo del
experimento, si no se le suministra veneno) es 0,068 (es ms probable que
sobreviva) aunque no es significativamente distinto de 1 (p=0,052). El estimador
del odds ratio para el aumento de una dosis es 4,539 (es decir el odds se
multiplica por esa cantidad por cada aumento de dosis) y es significativamente
distinto de 1 (p=0,036).
Cul sera el odds para la dosis 2? Se calcula:
Intervalos y contrastes
Modelo mltiple
Modelo mltiple
Es una generalizacin del modelo simple:
no caf
urbano
rural
urbano
rural
Cncer
32
15
no cncer
15
10
15
10
Modelo mltiple
En este caso de un bloque con una sola variable, la prueba sera equivalente a
la de Wald para Medio. El que no coincidan exactamente (12,040 la de Wald y
16,864 la del logaritmo del cociente de verosimilitudes) es debido a que ambas
son aproximadas. Si la discrepancia fuera muy grande indicara que el tamao
muestral es pequeo para aplicar estas pruebas.
Prueba de Hosmer-Lemeshow
Es otra prueba para evaluar la bondad del ajuste de un modelo de regresin
logstica, aunque su uso est ms discutido que la anterior. La idea es si el
ajuste es bueno, un valor alto de la p predicha se asociar (con un frecuencia
parecida a la p) con el resultado 1 de la variable binomial. Se trata de calcular
para cada observacin del conjunto de datos las probabilidades de la variable
dependiente que predice el modelo, agruparlas y calcular, a partir de ellas, las
frecuencias esperadas y compararlas con las observadas mediante la prueba
2.
Modelo mltiple
Modelo mltiple
Variables "dummy"
X2
X3
Dosis 0
Dosis 1
Dosis 2
Dosis 3
El modelo quedara
es decir
por lo tanto
Variables "dummy"
que es diferente para cada valor x2 de X2. Del mismo modo, el cambio en ln(p/q)
por una unidad de cambio en X2 manteniendo fijo X1 es
2 + 3 x1, o en trminos del OR, el odds ratio por una unidad de cambio en X2
manteniendo fijo X1 es
radicalmente distintos para el medio urbano (el odds ratio para el caf es 2,134)
que para el medio rural (el odds ratio para el caf es 0,5). Si se comparan estos
resultados con los del modelo sin el trmino de interaccin:
se observa, como era de esperar, un estimador para el odds ratio del caf,
intermedio entre los calculados en el supuesto anterior. Conviene, por
consiguiente, calcular la potencia del contraste con el que se rechaz la
existencia de interaccin. El contraste fue:
H0: 3 = 0
H1: 3 0
y la potencia es: 1 = Prob(rechazar H0|H1 verdadera). Con el nivel de
significacin =0,05, se rechaza H0 si
es decir si
es decir, la potencia del contraste es efectivamente muy baja y habra que ser
muy prudente a la hora de comunicar los resultados de este estudio.
http://www.hrc.es/bioest/Reglog_7.html (5 of 6) [02/01/2003 01:29:57]
Estrategias de modelizacin
Estrategias de modelizacin
Debido a los dos objetivos distintos que un anlisis de regresin puede tener es
difcil establecer una estrategia general para encontrar el mejor modelo de
regresin, es ms, el mejor modelo significa cosas distintas con cada objetivo.
En un anlisis predictivo el mejor modelo es el que produce predicciones ms
fiables para una nueva observacin, mientras que en un anlisis estimativo el
mejor modelo es el que produce estimaciones ms precisas para el coeficiente
de la variable de inters.
En ambos casos se prefiere el modelo ms sencillo posible (a este modo de
seleccionar modelos se le denomina parsimonia), de modo que en un anlisis
estimativo, se puede excluir del modelo una variable que tenga un coeficiente
significativamente distinto de cero y que su contribucin a la prediccin de la
variable dependiente sea importante, porque no sea variable de confusin para
la variable de inters (el coeficiente de dicha variable no cambia), en un anlisis
predictivo esa variable no se excluira.
Sin embargo, hay una serie de pasos que deben realizarse siempre:
i) Especificacin del modelo mximo.
ii) Especificacin de un criterio de comparacin de modelos y definicin de una
estrategia para realizarla.
iii) Evaluacin de la fiabilidad del modelo.
i) Especificacin del modelo mximo
Se trata de establecer todas las variables que van a ser consideradas.
Recurdese que el modelo saturado (el mximo que se puede considerar) tiene
n - 1 variables pero que, en general, el modelo saturado no tiene inters y el
modelo mximo deber tener menos variables independientes que el modelo
saturado (un criterio habitual es incluir como mximo una variable cada 10
eventos).
El criterio para decidir qu variables forman el modelo mximo lo establece el
investigador en funcin de sus objetivos y del conocimiento terico que tenga
sobre el problema, evidentemente cuanto menor sea el conocimiento previo
mayor tender a ser el modelo mximo.
Un modelo mximo grande minimiza la probabilidad de error tipo II o infraajuste,
que en un anlisis de regresin consiste en no considerar una variable que
realmente tiene un coeficiente de regresin distinto de cero.
Un modelo mximo pequeo minimiza la probabilidad de error tipo I o
sobreajuste (incluir en el modelo una variable independiente cuyo coeficiente de
regresin realmente sea cero).
Debe tenerse en cuenta tambin que un sobreajuste, en general, no introduce
http://www.hrc.es/bioest/Reglog_71.html (1 of 7) [02/01/2003 01:30:34]
Estrategias de modelizacin
Estrategias de modelizacin
consiste en que, cada vez que con el criterio anterior se incluye una variable, se
calculan los logaritmos del cociente de verosimilitudes de todas las incluidas
hasta ese momento como si fueran las ltimas y la variable con menor logaritmo
del cociente de verosimilitudes no significativo, si la hubiera, se elimina. Se
vuelven a calcular los logaritmos del cociente de verosimilitudes y se continua
aadiendo y eliminando variables hasta que el modelo sea estable.
Las variaciones a estas estrategias consisten en que, con cualquiera de ellas, se
puede contrastar varias variables en lugar de una sola y que, en aplicacin del
principio jerrquico, cuando se contrasta un trmino de interaccin, el modelo
debe incluir todos los trminos de orden inferior y, si como resultado del
contraste, dicho trmino permanece en el modelo, tambin ellos deben
permanecer en el mismo, aunque no se pueda rechazar que los coeficientes
correspondientes no son distintos de cero.
En cualquier caso, puede ser peligroso aplicar cualquiera de estas estrategias
automticamente (con un paquete estadstico, por ejemplo) por lo que se ha
comentado ms arriba sobre los distintos criterios dependiendo del objetivo del
estudio, los trminos de interaccin y las variables indicadoras.
Ejemplo 10
Estimar el efecto de los receptores de progesterona en la mortalidad de
pacientes operadas de cncer de mama. Datos: serie de 152 mujeres operadas
entre Oct 89 y Ene 92; 51 de ellas muertas por el tumor. Tenemos: las fechas de
nacimiento y ciruga, grado histolgico (1, 2 y 3), tamao del tumor (en cm),
nmero de ganglios afectados, y receptores de estrgenos y progesterona.
El modelo mximo estara formado por las variables: receptores de
progesterona (por ser la variable de inters), estrgenos, edad, tamao, grado y
nmero de ganglios (por si son variables de confusin); podemos considerar
tambin el trmino de interaccin entre los receptores de progesterona y el
tamao; como grado histolgico est codificado en 3 niveles podra ser
conveniente analizarlo a travs de 2 variables indicadoras
Para decidir si grado histolgico se introduce en el modelo como est o con
variables indicadoras, se compara el modelo que la contenga como est con
otro que tenga las indicadoras.
Estrategias de modelizacin
Estrategias de modelizacin
Estrategias de modelizacin
Estrategias de modelizacin
Otras lecturas
Silva Ayaguer L.C., Barroso Utra I.M. Seleccin algortmica de modelos en las
aplicaciones biomdicas de la regresin mltiple. Medicina Clnica.
2001;116:741-745.
Reglog
CAFE: -.6932
FACTOR
AUTOVALOR
MEDIO: 1.6094
INDICE CONDICION
CAFXME:
Reglog
3.41484
1.00000
.47826
2.67211
.08687
6.26991
.02004
13.05337
Const.
CAFE
MEDIO
CAFXME
.0059
.0039
.0057
.0037
.0472
.0273
.0370
.0264
.3060
.1064
.3113
.0878
.6409
.8624
.6460
.8821
alcohol
drogas
estrato
15
10
70
20
30
40
40
10
20
50
30
10
20
80
20
30
50
35
10
60
10
90
65
30
10
10
10
40
10
Para realizar el anlisis de estos datos usando regresin logstica condicional (con el
PRESTA) y con una estrategia hacia adelante se empezara con el modelo simple:
NOMBRE DE LOS DATOS: hepati
VARIABLE DEPENDIENTE: HEPA
NUMERO DE VARIABLES INDEPENDIENTES: 1 A SABER
ALCO
NUMERO DE ESTRATOS: 10 DEFINIDOS POR ESTRA
NUMERO MAXIMO DE ITERACIONES: 20
CONVERGENCIA OBTENIDA EN 6 ITERACIONES
VARIABLE
ALCO
ALFA
EXP(ALFA)
EE. ALFA
Ji2
.06021
1.06206
.02824
4.54553
.03116
Se encuentra una asociacin significativa tanto con la prueba de Wald como con la del
logaritmo del cociente de verosimilitudes. Ntese que el odds ratio de 1,06 es por
aumento de 1 gramo en el consumo diario de alcohol.
Se ajusta ahora a un modelo que contenga tambin el consumo de otras drogas y, en
aplicacin del principio jerrquico, el trmino de interaccin (una variable que sea el
producto de las variables drogas y alcohol) entre ambas.
NOMBRE DE LOS DATOS: hepati
VARIABLE DEPENDIENTE: HEPA
NUMERO DE VARIABLES INDEPENDIENTES: 3 A SABER
ALCO DROGA ALXDRO
CONVERGENCIA OBTENIDA EN 8 ITERACIONES
http://www.hrc.es/bioest/Reglog_9.html (3 of 5) [02/01/2003 01:33:36]
VARIABLE
ALCO
DROGA
ALXDRO
ALFA
EXP(ALFA)
EE. ALFA
Ji2
.04189
1.04278
.03264
1.64746
.19615
-1.27025
.28076
4.20961
.09105
.76070
.14089
1.15129
.19227
.53691
.52955
G.L.= 3
G.L.= 2
p= .00247
p= .04620
ALFA
EXP(ALFA)
EE. ALFA
Ji2
.04874
1.04994
.03298
2.18412
.13515
2.16908
8.75026
1.12496
3.71771
.05089
p= .00128
p= .65808
individuo en el que ocurri el evento y otro en el que no, la proporcin de los que
el modelo predice una mayor probabilidad para el que tuvo el evento. A partir de
un rea de 0,7 la discriminacin del modelo se considera aceptable.
Otras lecturas recomendadas
1. What do we mean by validating a prognostic model? Altman DG, Royston P.
Statist Med. 19: 453-473. 2000.
2. Assessing the generalizability of prognostic information. Justice AC. et al. Ann
Intern Med. 130: 515-524. 1999.
3. Utilizacin de los modelos probabilsticos de mortalidad (MPM II) para evaluar
la efectividad de la atencin a pacientes en estado crtico. Ru Monn M. et al.
Med Clin (Barc). 106: 565-570. 1996.
REGRESIN DE POISSON
REGRESIN DE POISSON
V. Abraira
Bibliografa:
V. Abraira, A.Prez de Vargas
Mtodos Multivariantes en Bioestadstica.
Ed. Centro de Estudios Ramn Areces. 1996.
Variables de Poisson
Una variable es de Poisson cuando es el nmero de eventos que ocurren en un
intervalo temporal o espacial de tamao dado (s), cumpliendo las siguientes
condiciones:
el nmero de eventos que ocurren en el intervalo es independiente del
REGRESIN DE POISSON
el
un intervalo unidad cuando todas las variables independientes son cero y
cociente de dicha probabilidad para un aumento de una unidad en la variable Xi
(riesgo relativo). Obsrvese que, al igual que en la regresin logstica, el modelo
supone efectos multiplicativos, es decir, si la variable Xi aumenta n unidades, la
probabilidad para la variable de Poisson se multiplica por
es decir,
la potencia n-sima de
Teniendo en cuenta, que para una variable de Poisson: = s el modelo
tambin se puede poner en funcin de como:
Ejemplo
Se quiere comparar la incidencia de cncer de piel en 2 ciudades, para ello se
registran los cnceres de piel aparecidos en el ltimo ao, 18 para la ciudad A y
30 para la B, cuyas poblaciones respectivas son 350.000 y 410.000.
Se trata de variables de Poisson con intervalo de personas-tiempo. Asumiendo
que ambas poblaciones se han mantenido constantes a lo largo de ese ao y
que todos los individuos eran susceptibles de enfermar, los tamaos de los
http://www.hrc.es/bioest/Poisson_2.html (1 of 2) [02/01/2003 01:35:51]
el logaritmo de la
con cero o
con 1.
Se puede plantear que esta diferencia en las incidencias pueda ser debida,
simplemente, a que ambas ciudades tengan una distinta pirmide de poblacin
(es sabido que la incidencia del cncer es distinta para distintos grupos de edad)
o quizs, y sera una hiptesis ms interesante a investigar, a algn otro factor.
Si se conoce la distribucin de las poblaciones para los distintos grupos de
edad, as como el grupo al que pertenece cada enfermo, se puede plantear un
modelo:
Edad
0 30
31 60
> 60
Poblacin Cncer
120.000
3
200.000
7
30.000
8
Ciudad B
Poblacin Cncer
130.000
4
220.000
10
60.000
16
El ajuste del modelo, con la prueba del logaritmo del cociente de verosimilitudes es
significativo. El primer contraste a realizar es sobre la interaccin. Como las variables
CIXED1 y CIXED2 son indicadoras y no tienen sentido por s solas, hay que realizarlo
globalmente para las dos con el logaritmo del cociente de verosimilitudes. Se ajusta,
por lo tanto, a un modelo sin ellas. El resultado es:
NOMBRE DE LOS DATOS: eje2pois
VARIABLE DEPENDIENTE: CANCER
VARIABLE TAMAO: POBLA
NUMERO DE VARIABLES INDEPENDIENTES:
CIUDAD EDAD1 EDAD2
3 A SABER
NUMERO DE CASOS: 6
NUMERO MAXIMO DE ITERACIONES: 20
CONVERGENCIA OBTENIDA EN 15 ITERACIONES
CASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0
VARIABLE
Const.
CIUDAD
EDAD1
ALFA
EXP(ALFA)
-10.55314 .00003
.13023 1.13909
.36802 1.44486
EE.
Ji2
p
ALFA
.41299 652.96970 .00000
.30131
.18681 .66947
.44909
.67153 .58226
EDAD2
2.23495 9.34601
.43171
26.80163 .00000
Const.
CIUDAD
EDAD1
EDAD2
El prximo contraste a realizar es para las variables EDAD1 y EDAD2, que tambin
tiene que ser global. Se ajusta a un modelo sin ellas y el resultado es:
NOMBRE DE LOS DATOS: eje2pois
VARIABLE DEPENDIENTE: CANCER
VARIABLE TAMAO: POBLA
NUMERO DE VARIABLES INDEPENDIENTES: 1 A SABER
CIUDAD
NUMERO DE CASOS: 6
NUMERO MAXIMO DE ITERACIONES: 20
CONVERGENCIA OBTENIDA EN 15 ITERACIONES
CASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0
Obsrvese que esta ltima estimacin coincide con la calculada anteriormente. Con la
http://www.hrc.es/bioest/Poisson_4.html (3 of 4) [02/01/2003 01:42:18]
obsrvese que, como el ajuste del modelo es muy bueno, coincide con la estimacin
que se puede obtener directamente de los datos:
su error estndar es
y del mismo modo para los otros grupos de edad y/o la otra ciudad.
Otras lecturas
Silva Ayaguer L.C., Barroso Utra I.M. Seleccin algortmica de modelos en las
aplicaciones biomdicas de la regresin mltiple. Medicina Clnica. 2001;116:741-745.
Ejemplo
http://www.hrc.es/bioest/Poisson_5.html (1 of 2) [02/01/2003 01:46:25]
Los salida del PRESTA del diagnstico de colinealidad para el modelo del
ejemplo anterior en el que se ha dividido la poblacin por 1.000 es:
REGRESION POISSON CON LOS COEFICIENTES:
Const.: -3.6454 CIUDAD: .1302 EDAD1: .3680
EDAD2 : 2.2350
FACTOR AUTOVALOR
1
2
3
4
PROPORCION DE VARIANZA
FACTOR
1
2
3
4
INDICE
CONDICION
2.64356
1.00000
1.00497
1.62188
.27931
3.07646
.07216
6.05269
EN LOS FACTORES
Const. CIUDAD
.0163 .0423
.0003 .0014
.0375 .8924
.9459 .0639
EDAD1
.0140
.1838
.0586
.7436
EDAD2
.0182
.0802
.1435
.7581
Ejemplo
Total
80
50
Gripe
3
5
No
vacunados
Total Gripe
91
5
43
10
El nmero de individuos con gripe en cada una de las situaciones es una variable
de Poisson, para la que se puede plantear un modelo de regresin. Para cada
individuo, el tener, o no, gripe, es una variable binomial puntual para la que se
puede plantear un modelo logstico.
http://www.hrc.es/bioest/Poisson_6.html (1 of 4) [02/01/2003 01:48:12]
EDAD
VACUNA
1.28379 3.61029
-.68495 .50412
.43865
.43865
8.56527 .00357
2.43822 .11406
VACUNA .18310
1.14577
http://www.hrc.es/bioest/Supervivencia_1.html
ANLISIS DE SUPERVIVENCIA
V. Abraira
Bibliografa:
V. Abraira, A. Prez de Vargas
Mtodos Multivariantes en Bioestadstica.
Ed. Centro de Estudios Ramn Areces. 1996.
E.T.Lee
Statistical Methods for Survival Data Analysis
Lifetime Learning Publications. 1980.
J.D.Kalbfleisch, R.L.Prentice
The Statistical Analysis of Failure Time Data
John Wiley & Sons. 1980.
Introduccin
Se denomina anlisis de supervivencia al conjunto de tcnicas que permiten
estudiar la variable tiempo hasta que ocurre un evento y su dependencia de
otras posibles variables explicatorias. Por ejemplo, en el estudio de
enfermedades crnicas o tratamientos muy agresivos, el tiempo hasta que
ocurre la muerte del enfermo (tiempo de supervivencia) y su dependencia de la
aplicacin de distintos tratamientos, pero en otras enfermedades, el tiempo
hasta la curacin, o el tiempo hasta la aparicin de la enfermedad. En procesos
de control de calidad se estudia el tiempo hasta que un cierto producto falla
(tiempo de fallo), o el tiempo de espera hasta recibir un servicio (tiempo de
espera), etc.
Debido a que la variable tiempo es una variable continua podra ser, en
principio, estudiada mediante las tcnicas de anlisis de la varianza o los
modelos de regresin. Hay, sin embargo, dos dificultades importantes para este
planteamiento. En primer lugar, en la mayor parte de los estudios citados la
variable tiempo no tiene una distribucin normal, ms bien suele tener una
distribucin asimtrica y aunque podran intentarse transformaciones que la
normalizaran, existe una segunda dificultad que justifica un planteamiento
especfico para estas variables, y es que para observarlas se tiene que
prolongar el estudio durante un perodo de tiempo suficientemente largo, en el
cual suelen ocurrir prdidas, que imposibilitan la observacin del evento.
Existen tres motivos por los que pueden aparecer estas prdidas, en primer
lugar por fin del estudio. Supngase, por ejemplo, que para evaluar una
intervencin quirrgica arriesgada se sigue en el tiempo, durante un ao, a dos
grupos de pacientes. A los de un grupo se les practic la intervencin y a los de
otro no, y se registr la duracin del intervalo de tiempo entre la intervencin (o
la entrada en el estudio, para el grupo no intervenido) y la muerte. Al final del
estudio puede haber individuos que no hayan muerto. Otra causa es la prdida
propiamente dicha, por ejemplo se quiere evaluar la eficacia de un tratamiento
http://www.hrc.es/bioest/Supervivencia_1.html (1 of 3) [02/01/2003 01:50:23]
http://www.hrc.es/bioest/Supervivencia_1.html
http://www.hrc.es/bioest/Supervivencia_1.html
6, sigue vivo al acabar el estudio, sera una prdida a los 6 meses (existe prdida
por fin del estudio y prdida por la izquierda).
Si se quisiera aplicar un modelo de regresin lineal a un estudio de este tipo,
habra que eliminar del mismo las observaciones perdidas, ya que para ellas no
se conoce el valor de la variable; sin embargo s se tiene alguna informacin til
sobre la misma: se sabe que es mayor que el tiempo en el que se produjo la
prdida.
y que verifica
y la funcin de supervivencia:
Ejemplo 1
Se sigue en el tiempo a 12 individuos con una prtesis cardaca y se encuentran
los siguientes tiempos de supervivencia en aos: 6*, 6, 6, 6, 10, 12*, 12, 15, 15*,
17, 22, 22, donde el asterisco indica prdida; es decir se perdieron 3 individuos
en los tiempos 6, 12 y 15. La manera ms cmoda de calcular los estimadores
anteriores es disponer los datos en una tabla como la que sigue:
12
F. riesgo F. supervivencia
3/12=0,25
10
1/8=0,125
0,750
12
1/7=0,143
0,656
15
1/5=0,2
0,562
17
1/3=0,333
0,450
22
2/2=1
0,300
Para analizar estos datos con un paquete estadstico, por ejemplo el SPSS, hay
que introducir dos variables: el tiempo y el status con un cdigo que indique si
en ese tiempo se ha producido el evento o es una perdida. La salida es
Survival Analysis for TIEMPO
Time
Cumulative
Events
Status
Number
Cumulative
Standard
Survival
Error
Remaining
6
1
11
1
2
6
3
10
,7500
,1250
,6563
,1402
,5625
,1482
,4500
,1555
,3000
,1605
,0000
,0000
9
6
0
8
10
4
7
12
6
12
0
5
15
6
1
4
15
6
0
3
17
7
1
2
22
8
1
1
22
9
1
0
Number of Cases:
12
Censored:
( 25,00%)
Events: 9
Por ejemplo, para los datos del ejemplo 1, las varianzas de las estimaciones de
la funcin de supervivencia y los intervalos de confianza al 95% construidos con
ellas son:
Tiempo
6
10
12
15
17
22
F.
superv.
0,7500
0,6563
0,5625
0,4500
0,3000
0,0000
Varianza
0,0156
0,0197
0,0220
0,0242
0,0257
-
Intervalo de
confianza
0,9950 0,5050
0,9310 0,3815
0,8530 0,2720
0,7548 0,1452
0,6145 - 0,0145
-
En la salida del SPSS figura, en lugar de la varianza, su raz cuadrada (el error
estndar), que es posible guardar en una nueva variable del archivo para, a
partir de ella y la funcin de supervivencia construir los intervalos de confianza.
y se obtiene
Obsrvese que cuando para un tiempo ocurre el evento para todos los individuos
en riesgo, como en este caso para 22, la varianza est indeterminada (aunque el
SPSS pone 0) puesto que el denominador es 0. Por otro lado, en los tiempos
extremos el intervalo de confianza puede sobrepasar el intervalo [0,1], en este
caso en el tiempo 17. Ello es debido a que la frmula de la varianza es slo
aproximada y a que la normalidad es asinttica. Este problema se puede evitar
de normalidad tambin asinttica
usando una transformacin logartmica de
pero cuyo campo de variacin es todo el campo real.
A partir de la funcin
cuyo varianza es
para los datos del ejemplo 1 por este procedimiento se obtienen los intervalos
de confianza al 95% dados en la siguiente tabla:
Tiempo
F. superv.
Varianza
6
10
12
15
17
22
0,7500
0,6563
0,5625
0,4500
0,3000
0,0000
0,0156
0,0197
0,0220
0,0242
0,0257
-
Intervalo de
confianza
0,9117
0,4084
0,8557
0,3204
0,7910
0,2437
0,7104
0,1549
0,6041
0,0564
-
Mtodo actuarial
Mtodo actuarial
Hay ocasiones en que no se dispone de observaciones individuales de los
eventos, sino de observaciones agrupadas por intervalos temporales o, incluso,
aunque se disponga de las mismas se agrupan para compactar su presentacin.
Por ejemplo, los datos de mortalidad para un pas durante una dcada se suelen
agrupar en intervalos anuales, en las denominadas tablas de vida o actuariales,
de modo que no se dispone del tiempo de fallecimiento de cada individuo, sino
del nmero de fallecidos en cada intervalo, en este caso anual.
Supngase que hay k intervalos, al principio de cada intervalo Ii, existen ni
individuos en riesgo, y durante el mismo se producen mi prdidas y di eventos.
Por lo tanto, en el conjunto del intervalo el nmero de individuos en riesgo es
variable, asumiendo que las prdidas se producen homogneamente a lo largo
del mismo, su nmero promedio es ni mi /2 y, en consecuencia, el estimador
del riesgo para el intervalo ser:
12 observations
Number
Entrng
Intrvl
ProbaStart
this
bility Hazard
Time
Intrvl
Densty
Rate
------ -------- -----,0
12,0
,0000
,0000
5,0
12,0
,0522
,0600
10,0
8,0
,0394
,0615
15,0
5,0
TIEMPO
Number
Wdrawn
Number
Exposd
Number
of
Propn
Propn
Cumul
Propn
During
to
Termnl
Termi-
Sur-
Surv
Intrvl
Risk
Events
nating
viving
at End
------
------
------
------
------
------
,0
12,0
,0
,0000
1,0000
1,0000
1,0
11,5
3,0
,2609
,7391
,7391
1,0
7,5
2,0
,2667
,7333
,5420
1,0
4,5
2,0
,4444
,5556
,3011
---
Mtodo actuarial
,0482
20,0
,0602
,1143
2,0
,4000
,0
2,0
2,0
1,0000
Intrvl
Start
Time
------,0
5,0
10,0
15,0
20,0
SE of
Cumul
Surviving
-----,0000
,1295
,1525
,1526
,0000
SE of
Probability
Densty
-----,0000
,0259
,0248
,0288
,0305
,0000
,0000
15,87
SE of
Hazard
Rate
-----,0000
,0342
,0430
,0774
,0000
Comparacin de funciones de
supervivencia
Como los estimadores de Kaplan-Meier son estimadores de mxima
verosimilitud y la teora establece que estos estimadores son asintticamente
normales, una primera aproximacin es usar dicha teora, es decir, si de una
poblacin con funcin de supervivencia S(t) se extraen dos muestras
independientes, y a partir de las mismas se calculan los estimadores
Ejemplo 2
Para hacerlo con el SPSS, se necesita crear un archivo con tres variables: tiempo,
estado (codificado, por ejemplo, 0: prdida, 1: muerte) y tratamiento (codificado,
por ejemplo, 0: tratamiento A, 1: tratamiento B).
y el resultado
Survival Analysis for TIEMPO
Factor TRATA = A
Time
Cumulative
Status
Number
Events
Standard
Survival
Error
Remaining
10
muerte
1
13
2
15
2
17
3
19
3
20
3
Cumulative
,8333
,1521
,6667
,1925
,4444
,2222
5
muerte
4
prdida
3
muerte
2
prdida
1
prdida
0
Number of Cases:
Events: 3
Censored:
( 50,00%)
Survival Time
Standard Error
95% Confidence
Interval
Mean:
17
13;
20
9;
25
)
(Limited to
Median:
20 )
17
Status
Number
Events
Cumulative
Standard
Survival
Error
Remaining
8
muerte
5
muerte
4
muerte
3
prdida
2
muerte
1
prdida
0
1
10
2
11
3
11
3
12
4
15
4
Number of Cases:
Events: 4
,8333
,1521
,6667
,1925
,5000
,2041
,2500
,2041
Survival Time
Censored:
Standard Error
( 33,33%)
95% Confidence
Interval
Mean:
12
10;
14
9;
13
)
(Limited to
Median:
15 )
11
Number
Percent
Events
Censored
Censored
TRATA
12
50,00
TRATA
B
2
Overall
5
33,33
41,67
2,23
df
Significance
,1352
Ejemplo 3
Standard
Error
Events
Remaining
1
muerte
6
muerte
5
muerte
4
prdida
3
muerte
2
muerte
1
prdida
0
1
3
2
7
3
8
3
12
4
12
5
15
5
Number of Cases:
Events: 5
,8571
,1323
,7143
,1707
,5714
,1870
,1905
,1676
Survival Time
Censored:
Standard Error
( 28,57%)
95% Confidence
Interval
Mean:
5;
13
8;
16
)
(Limited to
Median:
15 )
12
Status
Number
Cumulative
Standard
Survival
Error
Remaining
2
1
2
2
3
3
8
4
10
5
10
6
12
muerte
7
muerte
6
muerte
5
muerte
4
muerte
3
muerte
2
prdida
,7500
,1531
,6250
,1712
,5000
,1768
,2500
,1531
1
muerte
0
15
7
Number of Cases:
Events: 7
,0000
Survival Time
,0000
Censored:
Standard Error
( 12,50%)
95% Confidence
Interval
Mean:
4;
12
2;
14
)
Median:
)
Status
Number
Events
Cumulative
Standard
Survival
Error
Remaining
1
muerte
1
1
2
3
3
7
4
10
4
12
5
12
muerte
7
muerte
6
muerte
5
prdida
4
muerte
3
muerte
,7778
,1386
,6667
,1571
,5556
,1656
,2778
,1617
muerte
1
prdida
0
,1389
,1272
2
14
7
15
7
Number of Cases:
Events: 7
Survival Time
Censored:
Standard Error
( 22,22%)
95% Confidence
Interval
Mean:
5;
12
(Limited to
Median:
15 )
12
6;
Number
Percent
Events
Censored
Censored
HOSPITAL
2
24
19
28,57
HOSPITAL
B
12,50
HOSPITAL
2
C
22,22
Overall
5
20,83
,41
df
Significance
,8164
18
Alternativa paramtrica
Una alternativa al mtodo de Kaplan-Meier para estimar funciones de
supervivencia y realizar contrastes de hiptesis sobre las mismas, consiste en
asumir ciertas funciones de probabilidad para la variable tiempo de espera. Si
esta asuncin es razonable, y para averiguarlo habr que realizar pruebas de
bondad del ajuste, estos mtodos paramtricos son ms poderosos que el de
Kaplan-Meier.
El mtodo consiste en estimar, por mxima verosimilitud, los parmetros
caractersticos de la funcin, y usar su normalidad asinttica para realizar la
estimacin por intervalos y los contrastes de hiptesis.
Las pruebas de bondad de ajuste se realizan con la habitual prueba basada en
la ji-cuadrado, con la del logaritmo del cociente de verosimilitudes (como en
regresin logstica) o con mtodos grficos.
La prueba basada en la ji-cuadrado se realiza distribuyendo el periodo de
observacin en k intervalos y calculando el estadstico:
Funcin exponencial
Funcin exponencial
La funcin exponencial est definida por:
Usando las relaciones entre las tres funciones las funciones de supervivencia y
riesgo para esta variable son
Ejemplo 4
Calclese para los datos del ejemplo 1 la funcin de supervivencia estimada,
asumiendo un modelo exponencial, y realcese la prueba para la bondad del
ajuste.
Funcin exponencial
PC
V2.2
19-OCT-2001
ANALISIS DE SUPERVIVENCIA
MODELO EXPONENCIAL : S(t)=exp(-At)
NOMBRE DE LOS DATOS:
VARIABLE TIEMPO:
VARIABLE PERDIDAS:
eje1sup
TIEMPO
PERDID
NUMERO DE CASOS:
12
CASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO
PARAMETRO
.06040
ERROR ESTANDAR
.02013
34.43188
G.L.:
-17.044550
-34.260490
p= .000001
OBSERVADOS
.00
4.00
5.00
.00
ESPERADOS
3.00
3.00
3.00
3.00
CONT. JI2
3.0000
.3333
1.3333
3.0000
p= .021258
Funcin exponencial
PC
V2.2
19-OCT-2001
ANALISIS DE SUPERVIVENCIA
MODELO EXPONENCIAL : S(t)=exp(-At)
NOMBRE DE LOS DATOS:
VARIABLE TIEMPO:
VARIABLE PERDIDAS:
VARIABLE DEFINE GRUPOS:
GRUPO 1 Desde
GRUPO 2 Desde
NUMERO DE CASOS:
super5
TIEMPO
PERDID
TRATA
1.00 Hasta
2.00 Hasta
230
1.00
2.00
Funcin exponencial
GRUPO 1
PARAMETRO
.04826
ERROR ESTANDAR
.00464
94.83020
G.L.: 42
p= .000006
OBSERVADOS
5.00
17.00
10.00
9.00
13.00
7.00
10.00
8.00
11.00
9.00
9.00
ESPERADOS
10.64
10.64
10.64
10.64
10.64
10.64
10.64
10.64
10.64
10.64
10.64
CONT. JI2
2.9868
3.8073
.0381
.2517
.5253
1.2432
.0381
.6535
.0124
.2517
.2517
p= .345439
GRUPO 2
PARAMETRO
.08935
ERROR ESTANDAR
.00876
55.42084
G.L.: 30
p= .003227
OBSERVADOS
6.00
13.00
ESPERADOS
10.27
10.27
CONT. JI2
1.7772
.7241
Funcin exponencial
2.25
3.56
5.06
6.78
8.82
11.32
14.54
19.08
>
3.56
5.06
6.78
8.82
11.32
14.54
19.08
26.84
26.84
9.00
12.00
11.00
4.00
8.00
13.00
12.00
9.00
7.00
10.27
10.27
10.27
10.27
10.27
10.27
10.27
10.27
10.27
.1577
.2904
.0515
3.8302
.5028
.7241
.2904
.1577
1.0426
p= .388265
Ahora, con un tamao muestral mayor no hay discrepancia entre ambas pruebas
para la bondad del ajuste, las dos indican un buen ajuste. En la figura se presentan
las grficas (lneas continuas: estimaciones de las funciones usando el modelo
exponencial y aspas y cuadrados: el mtodo de Kaplan-Meier) y se observa que el
ajuste es muy satisfactorio.
Funcin exponencial
que comparndolo con el valor crtico z0,025= 1,96 permite rechazar la hiptesis
nula de igualdad.
Referencias
1
M.A.Gonzlez-Gay, R.Blanco, V.Abraira, C.Garca-Porra, D.Ibez,
M.T.Rigueiro, A.Snchez-Andrade, J.Guerrero, E.Casariego. Giant cell arteritis in Lugo,
Spain, is associated with low longterm mortality. Journal of Reumathology. 24: 21712176. (1997).
Funcin de Weibull
Funcin de Weibull
La funcin de Weibull est definida por:
es decir, el riesgo es creciente a lo largo del tiempo para > 1 (por ejemplo,
supervivencia de pacientes con una enfermedad crnica sin respuesta al
tratamiento, o materiales con fatiga), constante para = 1 (materiales sin fatiga)
y decreciente para < 1 (enfermos con ciruga mayor practicada con xito).
Ntese que calculando dos veces el logaritmo de la funcin de supervivencia
Ejemplo 6
Ajstese, con las pruebas de bondad de ajuste, la funcin de Weibull a los datos
de la tabla, donde en la columna Perdida figura 0 para muerte y 1 para prdida
y en Tiempo el tiempo en meses.
Funcin de Weibull
La salida del PRESTA para este problema (ntese que se denomina parmetro A
a y parmetro B a
P R E S T A
PC
V2.2
25-OCT-2001
ANALISIS DE SUPERVIVENCIA
MODELO WEIBULL : S(t)=exp[-(At)**B]
super6
TIEMPO
PERDID
161
A
B
PARAMETRO
.01778
2.37622
ERROR ESTANDAR
.00068
.17212
MATRIZ DE COVARIANZAS
A
B
http://www.hrc.es/bioest/Supervivencia_72.html (2 of 4) [02/01/2003 02:09:23]
Funcin de Weibull
A
B
.00000
-.00001
-.00001
.02963
107.24410
G.L.: 59
p= .000130
OBSERVADOS
20.00
8.00
10.00
13.00
17.00
20.00
5.00
14.00
10.00
5.00
ESPERADOS
16.10
16.10
16.10
16.10
16.10
16.10
16.10
16.10
16.10
16.10
CONT. JI2
.9447
4.0752
2.3112
.5969
.0503
.9447
7.6528
.2739
2.3112
7.6528
p= .000408
Funcin de Weibull
que comparndolo con el valor crtico z0,05= 1,64 permite rechazar la hiptesis
nula de modelo exponencial.
Referencias
1
Marubini E, Bonfanti G, Bozzetti F, et al. A prognostic score for patients resected for gastric
cancer. Eur J Cancer 29A: 845-850. (1993).
Funcin lognormal
Funcin lognormal
La variable T sigue una distribucin lognormal si lnT tiene una distribucin
normal de media y varianza . En consecuencia, la variable
siendo
la funcin de distribucin acumulativa de la normal reducida. Por lo
tanto un modo grfico de verificar esta distribucin es comparar la funcin de
supervivencia dibujada en papel lognormal con una recta.
La funcin estn caracterizadas por los dos parmetros y , que no son su
media y desviacin tpica. La estimacin de estos parmetros slo es sencilla en
el caso de que no haya prdidas y sta es la que implementa el PRESTA.
Se ha usado esta funcin para estudiar tanto la supervivencia en SIDA (1), como
el tiempo hasta la seroconversin de HIV+ (2).
Ejemplo 7
Estmese las funcin de supervivencia, asumiendo el modelo lognormal y
realcese la prueba de la bondad de ajuste, para los datos de la tabla.
P R E S T A
PC
V2.2
ANALISIS DE SUPERVIVENCIA
MODELO LOG-NORMAL : f(lnt)=N(A,B)
26-OCT-2001
Funcin lognormal
super72
VARIABLE TIEMPO:
TIEMPO
NUMERO DE CASOS:
121
PARAMETRO
ERROR ESTANDAR
2.32263
.04138
.20719
.02664
MATRIZ DE COVARIANZAS
A
.00171
.00000
.00000
.00071
INTERVALO
OBSERVADOS
<
10.00
5.69
ESPERADOS
12.10
CONT. JI2
.3645
Funcin lognormal
5.69 -
6.96
9.00
12.10
.7942
6.96 -
8.04
18.00
12.10
2.8769
8.04 -
9.09
12.00
12.10
.0008
9.09 -
10.20
17.00
12.10
1.9843
10.20 -
11.45
12.00
12.10
.0008
11.45 -
12.95
8.00
12.10
1.3893
12.95 -
14.96
9.00
12.10
.7942
14.96 -
18.28
16.00
12.10
1.2570
>
18.28
10.00
12.10
.3645
9.82645
G.L.:
p= .197686
Con la prueba de bondad de ajuste basada en la ji-cuadrado, que en este caso que
no hay prdidas funciona mejor, no se rechaza la hiptesis nula de modelo
lognormal y en la grfica tambin se observa que el modelo es satisfactorio.
Funcin lognormal
Referencias
1
Veugelers PJ, Cornelisse PG, Craib KJ, et al. Models of survival in HIV infection and their
use in the quantification of treatment benefits. Am J Epidemiol 148: 487-496. (1998).
http://www.hrc.es/bioest/Supervivencia_73.html (4 of 5) [02/01/2003 02:09:51]
Funcin lognormal
2
Muoz A, Xu J. Models for the incubation of AIDS and variations according to age and
period. Stat Med. 30: 2459-2473. (1996).
Funcin gamma
Funcin gamma
El modelo gamma est definido por la funcin de probabilidad
Ejemplo 8
Estmese la funcin de supervivencia, asumiendo el modelo gamma, y realcese la
prueba de la bondad de ajuste, para los datos de la tabla.
PC
V2.2
ANALISIS DE SUPERVIVENCIA
MODELO GAMMA : S(t)=1-I(A,Bt)*(Bt)**A/G(A)
95
27-OCT-2001
Funcin gamma
A
B
PARAMETRO
7.81341
.08169
ERROR ESTANDAR
.85924
.00947
MATRIZ DE COVARIANZAS
A
B
A
.73829
.00772
B
.00772
.00009
LOGARITMO DE MAXIMA VEROSIMILITUD SIN MODELO -388.936400
LOGARITMO DE MAXIMA VEROSIMILITUD DEL MODELO -460.552600
JI-CUADRADO:
143.23240
G.L.: 64
p= .000000
OBSERVADOS
.00
1.00
6.00
17.00
19.00
17.00
19.00
8.00
5.00
3.00
ESPERADOS
.02
1.15
7.07
15.81
20.45
18.87
13.86
8.65
4.77
4.36
CONT. JI2
.0182
.0205
.1621
.0901
.1023
.1846
1.9044
.0485
.0110
.4233
p= .888640
Funcin gamma
Igual que con el modelo de Weibull, un contraste que tambin interesa hacer es
s el modelo exponencial es adecuado, es decir si =1 contra la hiptesis
alternativa >1. Se hace con el estadstico
que comparndolo con el valor crtico z0,05= 1,64 permite rechazar la hiptesis
nula de modelo exponencial.
Hasta aqu se han estudiado mtodos que permiten estimar las funciones de riesgo
y supervivencia para una muestra aleatoria y comparar dos o ms estimaciones.
El objetivo ahora es plantear un modelo de regresin para el riesgo, o la
supervivencia, en funcin de variables "explicatorias", que permita comparar
dichas estimaciones, teniendo en cuenta el efecto de otras variables distintas de la
que se utiliza para definir los grupos.
Por ejemplo, la supervivencia a dos tratamientos alternativos puede depender
no slo del tratamiento, sino tambin de otras variables como la edad, el sexo, o
la gravedad de la afeccin de cada paciente. En los mtodos previos se asume
que el muestreo aleatorio hace que los distintos grupos sean homogneos con
respecto a todas las dems variables, sin embargo no siempre es as (el
muestreo aleatorio slo garantiza que las muestras homogneas sean las ms
probables) y, por otro lado, a veces interesa estimar la supervivencia para
distintos valores de las otras variables. Los modelos de regresin permiten
hacer ambas cosas.
Hay varios modelos de regresin propuestos, como el llamado modelo
acelerado en que se asume que la funcin de supervivencia es una funcin del
tiempo y de otras k variables (representadas por el vector, de dimensin k, X) de
la siguiente forma:
siendo (X,) una funcin de X con unos coeficientes , que seran los
coeficientes a estimar para el modelo.
Otros modelos asumen algunas de las funciones de supervivencia vistas antes
planteando el modelo de regresin para los parmetros de las funciones.
Sin embargo, el modelo ms popular, por su sencillez y facilidad para interpretar
los coeficientes , es el denominado modelo de riesgo proporcional o modelo de
Cox que es un modelo de la forma
Es decir, h0(t) es el riesgo cuando todas las variables Xi son 0, o riesgo basal,
que es variable con el tiempo.
Otra manera equivalente de expresarlo es:
es decir, el modelo plantea el logaritmo del riesgo relativo como una funcin
http://www.hrc.es/bioest/Supervivencia_8.html (1 of 2) [02/01/2003 02:12:34]
Teniendo en cuenta que los estimadores lo son por mxima verosimilitud, los
contrastes de hiptesis sobre cada coeficiente se hacen usando su normalidad
asinttica (prueba de Wald) y los contrastes de hiptesis sobre el modelo
completo o sobre un conjunto de coeficientes con el logaritmo del cociente de
verosimilitudes (exactamente igual que en regresin logstica).
que se distribuye como una ji-cuadrado con 1 grado de libertad y, por tanto, la
regin crtica para el contraste es
contrastes de Wald.
Estrategias de modelizacin
Las estrategias de modelizacin son exactamente las mismas que las utilizadas en los otros modelos de regresin,
contrastndose tambin del mismo modo la interaccin y la confusin y pudindose usar tambin las variables
dummy.
Ejemplo 9
Comparar la supervivencia de los tratamientos del ejemplo 5 controlando los posibles efectos de confusin e
interaccin de la edad.
En el ejemplo 5 se encontr que la supervivencia con ambos tratamientos ajustaba a un modelo exponencial, es
decir con ambos tratamientos el riesgo es constante (por lo tanto se cumple la asuncin de riesgo proporcional):
0,048 para el tratamiento 1 y 0,089 para el tratamiento 2, siendo ambos riesgos significativamente distintos.
Analizado con la regresin de Cox univariante
El modelo globalmente es significativo, evaluado con la prueba del logaritmo del cociente de verosimilitudes, que
el SPSS denomina prueba mnibus. El coeficiente del termino de interaccin no es distinto de 0 (p=0,931) por
lo tanto no se rechaza la hiptesis nula de no existencia de interaccin y se elimina esa variable
Obsrvese que la variable EDAD es una variable de confusin: el riesgo relativo ha disminuido desde 1,892
estimado con el modelo simple a 1,449, Adems ha dejado de ser significativo.
En consecuencia este sera el modelo final y la conclusin del anlisis es que, una vez controlado por la edad,
no hay diferencia significativa entre ambos tratamientos.
http://www.hrc.es/bioest/Supervivencia_10.html (1 of 2) [02/01/2003 02:14:24]
Otras lecturas
F.Pozo, J.R.Ricoy, P.Lzaro. Una estrategia de investigacin en el Sistema
Nacional de Salud: I. La epidemiologa clnica. Medicina Clnica 1994; 102:664669.
Prevalencia
Prevalencia
Es la proporcin de individuos de una poblacin que presentan el evento en un
momento, o periodo de tiempo, determinado. Por ejemplo la prevalencia de
diabetes en Madrid en el ao 2001 es la proporcin de individuos de esa
provincia que en el ao 2001 padecan la enfermedad. Se calcula
Caractersticas
Es una proporcin:
no tiene dimensiones
su valor oscila entre 0 y 1, aunque a veces se expresa como
porcentaje
Es un indicador esttico, que se refiere a un momento temporal
Indica la carga del evento que soporta la poblacin, tiene su mayor
utilidad en los estudios de planificacin de servicios sanitarios
En la prevalencia influye la velocidad de aparicin del evento y su
duracin; es por ello poco til en la investigacin causal y de medidas
teraputicas
Incidencia
Incidencia
La incidencia refleja el nmero de nuevos casos en un periodo de tiempo. Es
un ndice dinmico que requiere seguimiento en el tiempo de la poblacin de
inters. Cuando la enfermedad es recurrente se suele referir a la primera
aparicin.
Se puede medir con dos ndices: incidencia acumulada y densidad (o tasa) de
incidencia.
Incidencia acumulada
Es la proporcin de individuos que desarrollan el evento durante el periodo de
seguimiento. Se calcula
Caractersticas
Es una proporcin
no tiene dimensiones.
su valor oscila entre 0 y 1, aunque tambin se suele expresar como
porcentaje
Depende del tiempo de seguimiento
Se calcula sobre una cohorte fija, es decir no se permiten entradas de
nuevos individuos durante el seguimiento.
La principal limitacin de este ndice proviene del efecto de cohorte fija, puesto
que a lo largo del seguimiento generalmente se pierden individuos.
Ejemplo 1:
Se sigue durante 12 meses a un grupo de 6 individuos que han sufrido un
accidente cerebro-vascular (ACV), para evaluar la incidencia de recidiva. La
situacin se puede esquematizar en la figura
Incidencia
Los rombos rojos sealan recidivas mientras que los crculos verdes sealan
prdidas: el paciente B desapareci del estudio a los 2,5 meses, sin que hasta
ese momento hubiera sufrido una recidiva, el paciente D falleci por otra causa
no relacionada con el ACV, los pacientes C y F acabaron el periodo de estudio
sin recidiva.
La IA en los 2 aos de seguimiento es 2/6
Obsrvese la indeterminacin de este ndice debido a las prdidas; en este
ejemplo si se hubiera completado el periodo de observacin en todos los
individuos, B y D podran haber tenido un nuevo ACV y la IA sera distinta.
Densidad de incidencia
Caractersticas:
Ejemplo 2
Supngase para el ejemplo 1, el esquema de seguimiento de la figura:
Densidad de incidencia
desapareci del estudio a los 2,5 meses, sin que hasta ese momento hubiera
sufrido una recidiva, el D falleci por otra causa no relacionada con el ACV, los
pacientes C y F acabaron el periodo de estudio sin recidiva.
La suma de los tiempos de observacin es
Ejemplo 3:
En una muestra aleatoria de 500 personas de un rea, hay 5 diabticos. La
prevalencia estimada es
Ntese el valor negativo del lmite inferior que indica que para los datos de este
ejemplo la aproximacin es mala.
Eventos
Personastiempo
nF
d0
L0
F
d1
L1
Total
d
L
A partir de la tabla
Caractersticas
no tiene dimensiones.
rango de 0 a .
RDI=1 si no hay asociacin entre la presencia del factor y el evento.
RDI>1 si la asociacin es positiva, es decir si la presencia del factor se
asocia a mayor ocurrencia del evento y RDI <1 si la asociacin es negativa.
Ejemplo 4:
En un ensayo clnico para evaluar el efecto del tratamiento con un IECA ms un
diurtico opcional, en pacientes que haban sufrido un ACV, se estudi como
evento la ocurrencia de otro ACV en los siguientes 4 aos, los resultados fueron:
Placebo Tratamiento Total
ACV
420
307
727
Personas-ao 11889
11983
23872
A partir de aqu:
http://www.hrc.es/bioest/Medidas_frecuencia_61.html (1 of 2) [02/01/2003 02:19:39]
que indica que en los pacientes tratados con el tratamiento experimental la tasa
de incidencia de otro ACV es el 73% de la de los pacientes tratados con
placebo.
Referencia
PROGRESS Collaborative Group. Randomised trial of a perindopril-based bloodpressure-lowering regimen among 6105 individuals with previous stroke or
transient ischaemic attack. Lancet 2001; 358:1033-1041.
Riesgo relativo
Riesgo relativo
En epidemiologa se denomina riesgo a la probabilidad de ocurrencia de un
evento, tpicamente enfermar, aunque tambin morir, curar, etc.(en la
terminologa anglosajona se usan los trminos risk y hazard, este ltimo
especialmente si el evento es morir). Ms precisamente (vase el cap 6 de
Kleinbaum et al. para ms detalles) se define el riesgo como la probabilidad de
que un individuo, libre de enfermedad y susceptible de ella, la desarrolle en un
periodo determinado, condicionada a que el individuo no muera a causa de otra
enfermedad durante el periodo.
La incidencia acumulada es un estimador de esta definicin de riesgo, mientras
que la prevalencia es un estimador de otra posible definicin de riesgo:
probabilidad de que un individuo de una determinada poblacin tenga una
enfermedad en un momento o periodo de tiempo determinado.
En ambos casos se usa el cociente entre el riesgo en el grupo con el factor y el
riesgo en el grupo de referencia como ndice de asociacin y se denomina
riesgo relativo (RR).
En la tabla se representan esquemticamente los resultados de un estudio que
permita evaluar el RR, en la columna nF figuran los eventos (casos: a0) y los
no casos (b0) en la categora que no tiene el factor y en la columna F los de la
categora que s tiene el factor
Casos
nF
a0
F
a1
No casos
Total
b0
n0
b1
n1
A partir de la tabla
Caractersticas
no tiene dimensiones.
rango de 0 a .
RR=1 si no hay asociacin entre la presencia del factor y el evento.
RR>1 si la asociacin es positiva, es decir si la presencia del factor se
asocia a mayor ocurrencia del evento y RR<1 si la asociacin es negativa.
Ejemplo 5:
Riesgo relativo
Otra forma de resumir los resultados del ensayo clnico del ejemplo 4 es:
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
Y a partir de la tabla:
Odds ratio
Odds ratio
Existe otra manera, proveniente del mundo del juego, de representar la
probabilidad de ocurrencia de un evento y es mediante el cociente entre la
probabilidad de que ocurra el evento y la probabilidad de que no ocurra. Este
cociente, que en ingls se denomina odds y para el que no hay una traduccin
espaola comnmente aceptada, indica cuanto ms probable es la ocurrencia
del evento que su no ocurrencia.
El odds ratio (OR) es el cociente entre el odds en el grupo con el factor y el odds
en el grupo sin el factor. A partir de la tabla en la que en la columna nF figuran
los eventos (casos: a0) y los no casos (b0) en la categora que no tiene el
factor y en la columna F los de la categora que s tiene el factor
Casos
nF
a0
F
a1
No casos
Total
b0
n0
b1
n1
El OR se calcula
Caractersticas
no tiene dimensiones.
rango de 0 a .
OR=1 si no hay asociacin entre la presencia del factor y el evento.
OR>1 si la asociacin es positiva, es decir si la presencia del factor se
asocia a mayor ocurrencia del evento y OR<1 si la asociacin es negativa.
Relaciones entre el OR y el RR
RR ms intuitivo.
OR se puede estimar siempre y de la misma forma; el RR no se puede
en los diseos casos control.
El OR permite, mediante la regresin logstica, ajustar por variables de
confusin.
http://www.hrc.es/bioest/Medidas_frecuencia_63.html (1 of 2) [02/01/2003 02:21:16]
Odds ratio
Ejemplo 6:
Para la tabla del ejemplo 5:
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
El OR se calcula:
Casos
nF
a0
F
a1
No casos
Total
b0
n0
b1
n1
La DAR se calcula
Caractersticas
no tiene dimensiones.
rango de 1 a 1.
DAR=0 si no hay asociacin entre la presencia del factor y el evento.
DAR>0 si la asociacin es positiva, es decir si la presencia del factor se
asocia a mayor ocurrencia del evento y DAR<0 si la asociacin es negativa.
Ejemplo 7:
Para los datos del ejemplo 5:
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
La DAR es:
Casos
nF
a0
F
a1
No casos
Total
b0
n0
b1
n1
La RAR se calcula
Caractersticas
no tiene dimensiones.
rango de 1 a 1.
RAR=0 si no hay asociacin entre la presencia del factor y el evento.
RAR<0 si la asociacin es positiva, es decir si la presencia del factor se
asocia a mayor ocurrencia del evento y RAR>0 si la asociacin es negativa.
Ejemplo 8:
Para los datos del ejemplo 5:
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
La RAR es:
Casos
nF
a0
F
a1
No casos
Total
b0
n0
b1
n1
La DRR se calcula
Ejemplo 9:
Para los datos del ejemplo 5:
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
La DRR es:
y la RRR
que indica que el riesgo del grupo tratado se reduce un 26,8% del riesgo del
grupo control.
Casos
nF
a0
F
a1
No casos
Total
b0
n0
b1
n1
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
El NNT es:
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
Todos ellos calculados con la misma tabla, por lo tanto todos ellos expresan
exactamente el mismo efecto. Hay que notar, sin embargo que las relaciones
entre ellos no se mantienen entre diferentes estudios (es decir, por ejemplo no
siempre un RR=0,73 es equivalente a un OR=0,70 ni a un NNT=27, aunque
siempre RAR=3,7% es equivalente a NNT=27). Existe evidencia emprica1,2 de
que el efecto apreciado por los lectores de la investigacin mdica depende en
gran medida del ndice usado, por lo tanto conviene familiarizarse con ellos y
sus relaciones.
De la experiencia de cientos de meta-anlisis se desprende que los ndices
relativos (RR y OR) tienden a ser ms parecidos entre diferentes ensayos del
mismo tratamiento que los ndices absolutos (RAR y NNT), o dicho de otra
manera los ndices relativos seran caractersticos del tratamiento, mientras que
los absolutos dependeran del tratamiento y tambin del riesgo del grupo control.
Para decidir si el resultado de un estudio, expresado con un ndice absoluto
como el NNT, es aplicable en nuestro medio, hay que evaluar si el riesgo basal
del estudio se similar al de nuestro medio y en caso contrario adaptar el ndice a
nuestro riesgo basal. Igualmente, en un metanlisis, el clculo de un NNT global
puede ser poco informativo si en los ensayos individuales hay heterogeneidad
en los riesgos basales.
Otras lecturas recomendadas
1. Meneu Ricardo R., Peir S, Mrquez Caldern S. Influencia de la
presentacin de los resultados de los ensayos clnicos en la intencin de
prescribir: relativizando el riesgo relativo. Aten Primaria 1998; 21:446-450.
2. Bobbio M, Demichelis B, Giustetto G. Completeness of reporting trial results:
http://www.hrc.es/bioest/Medidas_frecuencia_7.html (1 of 2) [02/01/2003 02:23:56]
el estadstico
Eventos
Personastiempo
F
d1
L1
Total
d
L
Ejemplo 11:
Para construir el intervalo de confianza de la RDI de la tabla del ejemplo 4,
primero se debe calcular la
Placebo Tratamiento Total
ACV
420
307
727
Personas-ao 11889
11983
23872
Casos
nF
a0
F
a1
No casos
b0
b1
Total
n0
n1
Odds ratio
Reduccin absoluta del riesgo (la frmula es, obviamente, la misma para la
diferencia absoluta de riesgo)
Para la reduccin relativa del riesgo se dividen ambos lmites del intervalo de la
reduccin absoluta por el riesgo en el grupo control y para el nmero necesario
a tratar se invierten los lmites del intervalo de la reduccin absoluta del riesgo.
Ejemplo 12:
Los intervalos de todos los ndices calculados para los datos del ejemplo 5
Casos
No casos
Total
Placebo Tratamiento
420
307
2634
2744
3054
3051
Demostracin
Otra ms