Está en la página 1de 39

1

ANLISIS DE DATOS CUALITATIVOS:


TABLAS DE CONTINGENCIA
Notas
ndice
1. OBJETIVOS 2
2. TABLAS DE CONTINGENCIA BIDIMENSIONALES 2
2.1. Distribucin de frecuencias observadas 2
2.2. Modelos muestrales para las frecuencias observadas 2
2.3. Diseos muestrales apareado, longitudinal y de control nico 4
2.4. Independencia poblacional y muestral 4
2.5. Estimacin mximo verosmil de las frecuencias esperadas para los modelos muestrales usuales 5
3. INDEPENDENCIA EN TABLAS DE CONTINGENCIA BIDIMENSIONALES 5
3.1. Contrastes de independencia exactos 5
3.2. Contrastes de independencia asintticos 6
3.3. Contraste para una muestra multinomial de parmetros estimados 7
3.4. Correccin por continuidad: correccin de Yates 8
4. PARTICIN DE LOS ESTADSTICOS PARA DETECTAR FUENTES DE ASOCIACIN
8
4.1. Particin de tablas I x J en tablas 2 x 2 independientes 8
4.2. Particin en tablas dependientes 9
5. ANLISIS DE RESIDUOS 9
6. CONTRASTE DE INDEPENDENCIA PARA VARIABLES ORDINALES 10
6.1. Test de linealidad para una tabla I x J 10
7. ANLISIS DE TABLAS CUADRADAS GENERADAS POR DATOS DEPENDIENTES 10
7.1. Test de McNemar 11
7.2. Test binomial exacto 11
7.3. Extensin del test de McNemar degn Bower para contrastar simetra en una tabla cuadrada 12
7.4. Extensin de Stwart y Maxwell para contrastar la hiptesis de homogeneidad de proporciones
marginales en una tabla I x I generada por datos dependientes. 12
8. MEDIDAS DE ASOCIACIN EN TABLAS I X J 12
8.1. Introduccin 12
8.2. Medidas de asociacin en tablas 2 x 2 13
8.3. Medidas de asociacin en tablas I x J 17
8.4. Medidas de asociacin en tablas I x J 18
8.5. Inferencia en las medidas de asociacin 31
9. ANLISIS DE TABLAS DE CONTINGENCIA DE MAS DE DOS VARIABLES
CUALITATIVAS 32
9.1. Modelos log-lineales para tablas de contingencia 33
9.2. Seleccin del modelo 35
9.3. Indice de discrepancia 36
9.4. Comparacin entre dos modelos 37
9.5. Criterio Bayesiano de Informacin 37
9.6. Otras alternativas para analizar tablas de contingencia de ms de dos variables 38
10. BIBLIOGRAFA 39
2
1. Objetivos
Conocer la metodologa para el anlisis de tablas de contingencia bidimensionales, anlisis de
independencia y evaluacin del grado de asociacin entre los factores;
Introduccin al anlisis de tablas de dimensin superior y las distintas estructuras de relacin entre
factores;
Capacitar al alumno para interpretar los resultados de los mtodos aplicados y saber identificar y
seleccionar el procedimiento apropiado para cada conjunto de datos.
2. Tablas de contingencia bidimensionales
En la investigacin biomdica se encuentran con frecuencia datos o variables de tipo cualitativo, mediante
los cuales un grupo de individuos se clasifican en dos o ms categoras mutuamente excluyentes. Las
proporciones son una forma habitual de expresar frecuencias cuando la variable objeto de estudio tiene dos
posibles respuestas, como presentar o no un evento de inters (enfermedad, muerte, curacin, etc.).
Cuando lo que se pretende es comparar dos o ms grupos de sujetos con respecto a una variable
categrica, los resultados se suelen presentar a modo de tablas de doble entrada que reciben el nombre de
tablas de contingencia. As, la situacin ms simple de comparacin entre dos variables cualitativas es
aquella en la que ambas tienen slo dos posibles opciones de respuesta (es decir, variables dicotmicas).
En esta situacin la tabla de contingencia se reduce a una tabla dos por dos.
2.1. Distribucin de frecuencias observadas
El nico aspecto cuantificable en el anlisis cualitativo es el nmero de individuos que presenta una
combinacin los niveles de los factores. Estos valores se recogen en tablas de contingencia. (frecuencias
observadas de cada combinacin).
Ejemplo de tabla de contingencia:
factores factor B
nivel 1 nivel 2
i
n
i
nivel 1
11
n
12
n
1
1
J
i j
j
n i
=
=

factor A
nivel 2
21
n
22
n
1
2
J
i j
j
n i
=
=

j
n
i
1
1
I
i j
i
n j
=
=

1
2
I
i j
i
n j
=
=

1 1
I J
i j
i j
n n
= =
=

Los
i j
n representan el nmero de individuos observados en cada combinacin de los niveles de los
factores A, B y se consideran como la realizacin de una variable aleatoria con valores enteros y
positivos.
2.2. Modelos muestrales para las frecuencias observadas
El objetivo principal es contrastar la independencia entre los factores en estudio. Para ello se tendr en
cuenta los modelos de muestreo utilizados para disear el experimento que depender de la fijacin o no de
algunos de los totales marginales. Los modelos muestrales ms utilizados son:
2.2.1 Muestreo de Poisson
En el muestreo de Poisson los totales marginales y el total muestral varan libremente.
3
Una tabla generada por este tipo de muestreo est compuesta por
i j
N variables aleatorias independientes
asociadas a cada casilla y con distribucin de Poisson
( )
i j
P m
La distribucin de probabilidad conjunta para toda la tabla ser el producto de las I J distribuciones:
1 1
Pr , ,
!
i j i j
m n
I J
i j
i j i j
i j i j
e m
N n i j
n

= =
( = =


2.2.2. Muestreo multinomial completo
En el muestreo multinomial completo se fija de antemano el tamao de la muestra.
La distribucin del vector asociado a la tabla es una distribucin multinomial
{ } ( )
, , : 1, 2, , :1, 2,
i j
M n P i I j J :
1 1
1 1
!
Pr , ,
!
i j
I J
n
i j i j i j I J
i j
i j
i j
n
N n i j p
n
= =
= =
( = =

Adems
i j i j i j
m N n p ( = =

E
Nota: si la distribucin de una tabla de tipo Poisson se condiciona a que
1 1
I J
i j
i j
n n
= =
=

el resultado es una tabla con distribucin multinomial:


1 1
,
i j
i j I J
i j
i j
m
M n p
m
= =
| |
|
|
=
|
|
\ .

2.2.3. Muestreo multinomial independiente


En el muestreo multinomial independiente estn fijados de antemano los totales marginales de uno de los
factores.
Para generar una tabla de contingencia se seleccionan muestras aleatorias sencillas de tamaos
correspondientes a los tamaos asignados a los niveles de uno de los factores y se clasifican a los
individuos en cada muestra segn los niveles del otro factor.
( ) { } ( ) |
: :1, 2, , , , :1, 2, , ,
i j i i j
N j J M n P j J i
i

donde:
| i j
P es la probabilidad de clasificar a un individuo de la fila i-sima en la columna j-sima.
La funcin de probabilidad conjunta para la tabla de contingencia es:
|
1 1
1
|
!
Pr , :1, 2, , , :1, 2, ,
!
i j
I J
n i
i j i j i j J
i j
i j
j
i j i j i
n
N n j J i I P
n
m n P
= =
=
( = =

=

i
i

4
Nota: si una tabla sigue la distribucin de Poisson con frecuencias esperadas
i j
m , o multinomial con
probabilidades
i j
i j
m
P
n
= , entonces la distribucin condicionada del vector
( )
, :1, 2, ,
i j
N j J a que
1
J
i j i
j
N n
=
=
i
es multinomial con
|
i j
j i
i
m
P
m
=
i
2.2.4. Muestreo hipergeomtrico
En el muestreo hipergeomtrico estn fijados los totales marginales de ambos factores.
En este caso la distribucin de la tabla seria una distribucin hipergeomtrica multivariante.
2.2.5. Muestreo binomial negativo
En el muestreo binomial negativo estn fijadas las frecuencias de las casillas de un nivel de uno de los
factores.
2.3. Diseos muestrales apareado, longitudinal y de control nico
(a) Diseo apareado: consiste en seleccionar pares de individuos de caractersticas similares y clasificar a
cada elemento del par segn una caracterstica.
(b) Diseo longitudinal: se clasifica un conjunto de individuos segn un factor y en dos instantes diferentes
de tiempo.
(c) Mtodo de control nico: se clasifican a los individuos segn dos tratamientos diferentes del factor en
estudio.
Tanto en el caso (b) como en el (c) se considera que el individuo ms parecido a uno mismo es el propio
individuo.
2.4. Independencia poblacional y muestral
Considrese una tabla de contingencia I J generada por un modelo multinomial completo (MMC) y sea
i j
p la probabilidad poblacional de que un individuo sea elegido en la casilla ( ) , i j . El conjunto de todas
estas probabilidades para toda la tabla d como resultado una tabla similar a la de contingencia con sus
respectivas propiedades marginales definidas.
Para un modelo MMC la hiptesis de independencia entre factores es:
i j i j
P P P =
i i
o
i j
i j
m m
m
n
=
i i
En el caso de un modelo multinomial incompleto (MMI) se estudiar la homogeneidad de proporciones
independientes.
|1 | 2 |
: 1, 2, ,
j j j I j
P P P P j J = = = =
i

o
j
i j i
m
m n
m
=
i
i
i i
donde:
1 1
I J
i j
i j
m m
= =
=
ii
En el caso de tablas cuadradas generadas por datos dependientes, las hiptesis a contrastar son la de
simetra de proporciones marginales y la de homogeneidad de proporciones marginales, es decir:
5
, : 1, 2, ,
, : 1, 2, ,
i j j i
i i
P P i j I
P P i j I
=
=
i i

respectivamente.
2.5. Estimacin mximo verosmil de las frecuencias esperadas para los modelos
muestrales usuales
Sea
{ }
, :1, 2, , , : 1, 2, ,
i j
n i I j J el conjunto de frecuencias observadas. Considrese el modelo
multinomial completo:
La funcin de mxima verosimilitud ser:
( )
1 1
1 1
!
!
i j
I J
n
i j i j I J
i j
i j
i j
n
P P
n
= =
= =
=

L
Maximizando el segundo factor mediante el mtodo de Lagrange se obtienen las estimaciones:

i j
i j
n
P
n
=
3. Independencia en tablas de contingencia bidimensionales
Contraste de la hiptesis de independencia en una tabla de contingencia bidimensional.
3.1. Contrastes de independencia exactos
En caso de muestras pequeas.
Procedimiento:
(a) Determinar el espacio muestral del diseo empleado en la tabla observada (las tablas);
(b) Seleccionar de todas las tablas del apartado anterior las que se alejan tanto o ms de
0
H que la
tabla observada en la direccin de
1
H ;
(c) Calcular las probabilidades de ocurrencia de dichas tablas bajo la
0
H ;
(d) Calcular el valor p del test, sumando las probabilidades de dichas tablas;
(e) Comparar el valor p con el nivel de significacin prefijado.
Si p > se acepta la
0
H ;
Si p se rechaza la
0
H .
Inconvenientes:
(a) El clculo de la probabilidad exacta de las tablas puede depender de parmetros desconocidos. Se
soluciona estimando los;
(b) Cuando aumenta la muestra o los niveles de los factores el clculo del valor p es muy laborioso.
3.1.1. Contraste de independencia en el modelo muestral hipergeomtrico
(a) Test exacto de Fisher de asociacin positiva de una cola
Las hiptesis a contrastar son:
SIMETRIA HOMOGENEIDAD
6
0 1| 1 1| 2
1 1| 1 1| 2
:
:
H P P P
H P P
= =

Se calcula el valor p del test sumando las probabilidades de las tablas cuyo
11
n sea mayor o igual que el
de la tabla observada. Se compara con .
(b) Test exacto de Fisher de asociacin negativa de una cola
Las hiptesis a contrastar son:
0 1|1 1| 2
1 1|1 1| 2
:
:
H P P P
H P P
= =
<
Se calcula el valor p del test sumando las probabilidades de las tablas cuyo
11
n sea menor que el de la
tabla observada. Se compara con .
(c) Test exacto de Fisher de dos colas
Las hiptesis a contrastar son:
0 1|1 1| 2
1 1|1 1| 2
:
:
H P P P
H P P
= =

Las tablas que se alejan de


0
H son las que verifican que
11 11

obs
D D
donde
11 11 11

D n m =
11 11 11


obs obs
D n m =
La probabilidad de ocurrencia de una tabla es:
1 2 2
1
2 1 2 1
11 12 21 22
Pr , ,
! ! ! !
! ! ! ! !
i j
i j
n
p N n N n
N
n n n n
n n n n n
(
= = = =
(
(

=
i i i
i
i i i i

3.1.2. Contraste exacto en el modelo muestral multinomial independiente


(a) Test de homogeneidad de proporciones
Las hiptesis a contrastar son:
0 1|1 1| 2
1 1|1 1| 2
:
:
H P P P
H P P
= =

La probabilidad de ocurrencia de una tabla cualquiera es:


( )
2 1
1 2
11 12 21 22
! !
, 1
! ! ! !
n n
i j i j
n n
P P N n i j p p
n n n n
( = = =

i i
i i
3.2. Contrastes de independencia asintticos
3.2.1. Contraste
2
de bondad de ajuste a una muestra multinomial de parmetros conocidos
Las hiptesis a contrastar son:
7
0
0
0
1
:
:
i i
i i
H P P
H P P
=

Pearson propuso el siguiente estadstico:


( )
2
0
2
0
1
I
i i
i
i
N n P
n P
=

=

que se distribuye segn una ley de
2
con 1 I grados de libertad y un nivel de confianza .
se rechazar la hiptesis si el valor observado es mayor que el valor esperado.
3.3. Contraste para una muestra multinomial de parmetros estimados
Las hiptesis a contrastar son:
0
0
0
1
:
:
i i
i i
H P P
H P P
=

Se propone el siguiente estadstico


( )
2
2
1

I
i i
i
N n P
n P
=

=

que se distribuye segn una ley
2
con 1 I p grados de libertad.
Se rechazar la hiptesis nula si el valor observado es mayor que el valor esperado.
3.3.1. Contraste
2
de independencia
Las hiptesis a contrastar son:
0
1
:
:
i j i j
i j i j
H P P P
H P P P
=

i i
i i
El estadstico propuesto para realizar este contraste es el siguiente:
( )
2
2
1 1

I J
i j i j
i j
i j
N m
m
= =

=

teniendo en cuenta que bajo la hiptesis nula
0
H se tiene:

i j
i j
n n
m
n
=
i i
Dicho estadstico se distribuye segn una
2
con ( )( ) 1 1 I J grados de libertad.
Adems si el valor observado supera al esperado, se rechazar la
0
H .
3.3.2. Contraste
2
de homogeneidad de proporciones
Las hiptesis a contrastar son:
0 |1 | 2
1 |1 | 2
:
:
j j j
j j j
H P P P
H P P P
= = =

i
i

teniendo en cuenta que bajo la hiptesis nula


0
H se verifica:
8
|

i j
i j i j i i j
n n
m n P n P
n
= = =
i i
i i i
.
El estadstico es el mismo utilizado en el contraste anterior.
3.3.3. Contrate de independencia de razn de verosimilitudes
Las hiptesis a contrastar son:
0
1
:
:
i j i j
i j i j
H P P P
H P P P
=

i i
i i
.
El estadstico utilizado en este test es:
( )
( )
1 1
1 1
i j
i j
I J
n
i j
i j
I J
n
n
i j
i j
n n
n n
= =
= =
=

i i
.
Wilks demostr que ( )
2
2ln G = se distribuye bajo la hiptesis nula segn una ley de
2
con
( )( ) 1 1 I J grados de libertad:
2
1 1
2 ln

I J
i j
i j
i j
i j
n
G n
m
= =
| |
=
|
|
\ .

La hiptesis nula se rechaza si el valor observado del estadstico es mayor que el esperado para un nivel de
significacin prefijado.
3.4. Correccin por continuidad: correccin de Yates
El estadstico corregido tiene la siguiente expresin:
2
2
1 1
1

i j i j I J
c
i j
i j
n m
m
= =
| |

|
\ .
=

y se distribuye segn una ley de
2
con ( )( ) 1 1 I J grados de libertad.
4. Particin de los estadsticos para detectar fuentes de asociacin
4.1. Particin de tablas I x J en tablas 2 x 2 independientes
(Nota: aprovechando la reproductividad de la
2
, cualquier variable aleatoria con dicha distribucin y
grados de libertad se puede poner como suma de variables aleatorias
2
independientes cuyos grados de
libertad sumen ).
Landcaster e Irving propusieron el siguiente mtodo para descomponer una tabla en subtablas
independientes 2 x 2:
1 subtabla: dos primeras columnas.
2 subtabla: suma de las dos primeras columnas y la 3 columna.
3 subtabla: suma de las tres primeras columnas y la 4 columna.
...
La forma general de dichas tablas es:
9
j
T
1 1 1 1
1
2 2 2 1
1
J
j
k j
k
J
j
k j
k
n S n
n S n
+
=
+
=
=
=

1
1
1
2
j
j
S
S
+
+

1
j
j
S n
+

1
.
j
S
+
El
2
G de la tabla original se descompone como suma de los estadsticos de razn de verosimilitudes
asociados a cada una de las subtablas construidas, cosa que no ocurre con el
2
de Pearson.
Kimball propone el siguiente estadstico para la tabla j-sima:
( )
2
2
2 1 1 1 2
2
1
1 2 1
j j
i j j
j j j
j
n S n n S
n n S n S
+ +
+
+

=
i i i i i
El contraste se realiza en cada un de las subtablas y en cualquier caso se realiza a un nivel de significacin
1 j

.
Esta descomposicin en tablas independientes no es nica. Para comprobar que una particin da lugar a
componentes independientes basta con sumar los estadsticos de razn de verosimilitudes de cada
subtabla y comprobar que coincide con el asociado a la tabla completa.
Condiciones para obtener tablas independientes:
suma de grados de libertad de las subtablas = grados de la tabla completa;
cada frecuencia observada de la tabla original aparece en una sola subtabla;
los totales marginales en la tabla original aparecen en una sola subtabla.
4.2. Particin en tablas dependientes
Suponiendo que haya asociacin se desea comprobar si, fijado un nivel de un factor, hay dependencia con
los restantes niveles. En este caso no se verifica que la suma de los
2
G y Kimball de las subtablas sea
igual al Pearson de la tabla original. El contraste se realiza a un nivel de significacin
2 ( 1) j

5. Anlisis de residuos
Si en una tabla de contingencia la hiptesis de independencia se ha visto rechazada, mediante el anlisis de
residuos se puede detectar los niveles de los factores que pueden ser los causantes de tal asociacin, se
puede estudiar la relacin entre parejas de variables.
Con el fin de realizar la prueba correspondiente se ha de calcular una nueva tabla donde las casillas sean
los residuos las diferencias entre los valores observados y los esperados en el supuesto de
independencia. Cuanto mayor sea el valor de los residuos ms probable es que la relacin entre las parejas
de categoras sea significativa.
Con el fin de poder utilizar estos residuos en una prueba hay que realizar las dos operaciones siguientes:
(a) Eliminar el efecto el efecto que sobre su valor puedan tener los marginales de las dos variables
independientemente de cul sea la relacin entre dos categoras, cuanto mayor sea los marginales
mayor ser la probabilidad de que los residuos sean grandes. Al valor de los residuos as obtenidos se
llamar
i j
e ;
10
(b) Normalizarlos para ver su distribucin de probabilidades. Los
i j
d valores obtenidos sern los residuos
ajustados de Haberman (1978) cuya distribucin es aproximadamente normal en una distribucin
normal, como se sabe, valores superiores a 1,96 son estadsticamente significativos al nivel 0,05.
Residuos estandarizados:

i j i j
i j
i j
n m
e
m

=
La varianza estimada de los residuos:

( )
var 1 1
i j
i j
n n
e
n n
| | | |
=
| |
\ . \ .
i i
Residuos ajustados:

( )
var
i j
i j
i j
e
d
e
=
6. Contraste de independencia para variables ordinales
En variables ordinales es aconsejable aprovechar la informacin que se pueda obtener del orden de los
niveles de los factores.
6.1. Test de linealidad para una tabla I x J
Consiste en descomponer el
2
en dos componentes independientes que permiten contrastar si existe
relacin lineal significativa entre dos variables ordinales que han sido codificadas.
Se considera:
:
:
i
j
x cdigos por filas
y cdigos por columnas
Se estiman los parmetros de la recta de regresin de una variable sobre la otra por mnimos cuadrados,
designando una variable como explicativa y la otra como la explicada. El estimador b de la pendiente de la
recta de regresin proporciona la tendencia o tipo de relacin entre X e Y .
Una vez estimado el parmetro b , se contrasta su significacin:
0
1
: 0
: 0
H b
H b
=

Fijado un nivel de significacin se rechaza la hiptesis nula si


( )
2

var
b
b
es mayor que el valor observado de una
2
1,
.
7. Anlisis de tablas cuadradas generadas por datos dependientes
Este tipo de tablas est generadas por diseo apareado, longitudinal o de control nico.
Se clasifica a los individuos segn una caracterstica en dos instantes de tiempo diferentes, bajo dos
tratamientos distintos.
Se trata de ver si hay cambios significativos en la variable de inters bajo tratamientos distintos o en dos
instantes de tiempo determinados.
Las hiptesis de inters son las de simetra y la de homogeneidad.
11
7.1. Test de McNemar
Considrese una tabla generada segn los diseos anteriores.
Las hiptesis a contrastar son:
0 1 1 12 21
1 1 1
:
:
H P P P P
H P P
= =

i i
i i
Este test se basa en el estadstico
2
. Bajo
0
H y suponiendo MMC los estimadores mximo verosmiles de
las frecuencias esperadas son:
11 11
22 22
12 21
12 21


2
m n
m n
n n
m m
=
=
+
= =
Sustituyndolos en el estadstico se obtiene:
12 21 2
12 21
n n
n n

=
+
que se distribuye segn una
2
1,1

Se rechaza si el valor observado es mayor que el valor esperado.


La correccin de Yates tambin se puede aplicar a dicho estadstico.
7.2. Test binomial exacto
7.2.1. A dos colas
Las hiptesis a contrastar son:
0 1 1 12 21
1 1 1
:
:
H P P P P
H P P
= =

i i
i i
Siendo
12 21
m n n = + , la probabilidad de ocurrencia de una tabla cualquiera es:
12
12
0, 5
m
n
m
P
n
| |
=
|
\ .
El valor p del test es:
12
12
12 12
/
n n
obs
n
n p p
p p

=

7.2.2. A una cola de asociacin positiva
Las hiptesis a contrastar son:
21 12 1
21 12 0
:
:
P P H
P P H
>
=
El valor p del test es


=
obs
n n obs
p p n n
n
p p
12 12
12 12
12
/
7.2.3. A una cola de asociacin negativa
Las hiptesis a contrastar son:
12
0 12 21
1 12 21
:
:
H P P
H P P
=
>
El valor p del test es
12
12 12
12 12
/
obs n n
obs
n
n n p p
p p

=

7.3. Extensin del test de McNemar degn Bower para contrastar simetra en una tabla
cuadrada
Se contrasta la hiptesis de simetra
0
1
: ;
:
i j j i
i j j i
H P P i j i j
H P P
= >

Bajo
0
H y suponiendo MMC, los estimadores mximo verosmiles de las frecuencias esperadas son:

2
i i i i
i j j i
i i
m n
n n
m
i j
=
+
=

Sustituyendo estos estimadores en el estadstico


2
se obtiene el siguiente estadstico:
( )
2
2
1 1
I J
i j j i
i j
i j j i
n n
i j
n n
= =

= <
+

Bajo la hiptesis nula se distribuye segn


( )
2
1
2
I I
.
Se rechazar dicha hiptesis si el valor observado es mayor que el valor esperado.
7.4. Extensin de Stwart y Maxwell para contrastar la hiptesis de homogeneidad de
proporciones marginales en una tabla I x I generada por datos dependientes.
Es interesante cuando la hiptesis de simetra es rechazada.
Se propone el siguiente estadstico:
2 1 1
d v d

=
donde: d es un vector columna formado por cualquiera de las diferencias
i
d
i i
n n =
i i
; y
v es la matriz cuyos elementos son 2
i i i i i i
v n n n = +
i i
,
( )
i j i j j i
v n n = +
De forma que bajo la
0
H tiene distribucin asinttica con ( ) 1 I grados de libertad.
8. Medidas de asociacin en tablas I x J
8.1. Introduccin
Cuando la hiptesis de independencia es rechazada se puede plantear cul es el grado de asociacin y la
direccin en que se produce tal asociacin.
Las medidas de asociacin son parmetros poblacionales que dependen de las probabilidades
poblacionales. Estas deben ser fcilmente interpretables y deben estar acotadas de manera que los factores
13
indiquen asociacin perfecta o falta de asociacin. Suelen estar normalizadas tomando valores entre 0 y 1
entre 1 y 1, lo cual permite la comparaciones entre tablas de diferentes tamaos.
A veces los valores extremos no se alcanzan an cuando haya asociacin perfecta.
Se distinguen dos tipos de asociacin:
(a) Estricta, perfecta, cada nivel de uno de los factores est asociado a un nico nivel del otro factor.(en
cada columna hay una nica probabilidad poblacional no nula);
(b) Implcita:
asociacin perfecta implcita de tipo I: en cada fila habr una sola probabilidad no nula pero en
alguna columna habr ms de una probabilidad no nula;
asociacin perfecta implcita de tipo II: algn nivel del primer factor est relacionado con ms de
un nivel del segundo factor o viceversa.
Otras propiedades deseables son la simetra y la invarianza.
Se pueden clasificar segn varios criterios:
(a) Medidas parciales y globales;
(b) Medidas nominales y ordinales;
(c) Medidas simtricas o asimtricas.
8.2. Medidas de asociacin en tablas 2 x 2
8.2.1. Funciones del cociente de probabilidad
Supngase una tabla generada por MMC con probabilidades poblacionales
i j
P
Cociente de probabilidad
Sinnimos: razn de productos cruzados, razn de probabilidades, razn de momios, razn de ventajas,
razn de posibilidades, odds ratio (OR).
El cociente de probabilidad se define como:
probabilidad de ocurrencia
ventaja de un suceso
probabilidad de no ocurrencia
=
22
1 21 11 22
12
2 12 21
11
p
w p p p
p
w p p
p
= = =
Propiedades:
(a)
| |
0 , ;
(b) no est definido si
12
p o
21
p son 0. Si las dos son cero hay asociacin perfecta estricta positiva. Si
alguno es nulo hay asociacin perfecta implcita de tipo II;
(c) 0 = cuando
11
p y/o
22
p son nulas. Si las dos son nulas hay APEN. Si una de ellas es nula hay
AIT II;
(d) 1 dependencia entre factores = ;
(e) 1 asociacin positiva > ;
(f) 1 asociacin negativa < ;
(g) invariante frente a cambios de escala en filas y/o columnas;
(h) el cambio de orden en filas o columnas: mismo grado de asociacin pero en direccin opuesta;
El estimador de es
14
11 22
12 21

n n
n n
=
con similar interpretacin.
Una medida simtrica es
*

ln = que toma valores entre , .
*

1 hay independencia = ;
*

1 asociacin positiva > ;


*

1 asociacin negativa < .


En caso de haber ceros muestrales se propone el siguiente estimador:
( ) ( )
( ) ( )
11 22
12 21
0, 5 0, 5

0, 5 0, 5
n n
n n
+ +
=
+ +
El clculo de OR se asocia principalmente a estudios de corte transversal y de casos y controles, sin
embargo tambin se puede calcular para estudios de cohorte en vez del el RR donde el OR de inters ser
el de enfermedad y no el de exposicin como en el de estudio de caso y control.
La odds ratio (OR) para estudios de casos y controles, y transversales.
Debido al diseo de estos estudios, no se puede calcular riesgo.
Un grupo de individuos que presentan una enfermedad de inters, se comparan con un grupo de controles
que no padecen la enfermedad y se observa si presentaron o no la exposicin en el pasado.
Dada la siguiente tabla:
enfermedad
si no
si a b
expuestos
no c d
total a + c b + d
" "
" "
a
odds enfermos a d
c
OR
b
odds no enfermos c b
d

= = =

Por ejemplo: un grupo de enfermos de cncer de pulmn se comparan con un grupo de controles tambin
ingresados en el hospital pero por otros motivos que no sea cncer de pulmn. Posteriormente se analiza si
estaban expuestos o no al tabaquismo.
cncer
si no
si 688 650
tabaquismo
no 21 59
total 709 709
Por cada paciente fumador entre los que no presentan cncer hay 2,97 fumadores entre los que presentan
cncer.
15
688
" " 32, 8
21
2, 97
650
" " 11, 0
59
odds enfermos
OR
odds no enfermos
= = = =
Los pacientes fumadores tienen 2,97 ms riesgo de padecer cncer que los pacientes no fumadores.
Intervalo de confianza de un OR
A partir de los datos observados en una muestra de sujetos, se trata de estimar cual puede ser el OR en
la poblacin. Esta estimacin se realiza por intervalo con un determinado nivel de confianza.
Cuando los efectivos en cada una de las casillas son mayores de 5 la frmula para el clculo del
intervalo de confianza IC:
( )
( )
( )
2
1 1 1 1
ln
1 100
OR z
a b c d
IC e

+ + +
=
Para los datos del ejemplo y si se desea calcular el intervalo de confianza del 95 %:
( )
( )
( )
1 1 1 1
ln 2,97 1,96
688 650 21 59
1 0, 05 100 1, 79 4, 95 IC e
+ + +
= =
Q de Yule
11 22 12 21
11 22 12 21
1
1
p p p p
Q
p p p p


= =
+ +
Propiedades:
0 Q independencia = ;
0 1 Q asociacin positiva cuando > > ;
0 1 Q asociacin negativa cuando < < ;
1 Q asociacin perfecta estricta positiva = ;
1 Q asociacin perfecta estricta negativa = .
Valor muestral:
11 22 12 21
11 22 12 21

n n n n
Q
n n n n

=
+
8.2.2. Medidas que son funcin del coeficiente de correlacin
Codificando con 0 y 1 las variables de una tabla de contingencia se puede utilizar como medida de
asociacin el cuadrado del coeficiente de correlacin de Pearson:
( )
| |
2
11 22 12 21
2
1 2 1 2
1 , 1
p p p p
r
p p p p

=
i i i i
Sin embargo, no permite determinar la direccin de la asociacin. Para ello se considera el coeficiente de
correlacin:
( )
| |
11 2 2 1 2 21
1 2 1 2
1 , 1
p p p p
r
p p p p

=
i i i i
Propiedades:
Si r vale 0 hay independencia;
Si r vale 1 hay asociacin perfecta estricta negativa;
Si r vale 1 hay asociacin perfecta estricta positiva;
La asociacin implcita de tipo II no implica que tome valores extremos;
16
r es invariante frente a cambios en orden de filas o columnas;
r cambia de signo si se cambia el orden de las filas o columnas.
La estimacin muestral es:
( )
11 22 12 21
1 2 1 2
n n n n
n n n n

=
i i i i
con la misma interpretacin.
8.2.3. Medidas para comparar proporciones
Suponiendo dos factores, uno explicativo y otro explicado, se definen las siguientes medidas asimtricas:
Diferencia de proporciones
1| 1 1| 2
p p p =
Propiedades:
p vale 0 si hay independencia;
p vale 1 si hay asociacin perfecta estricta positiva;
p vale 1 si hay asociacin perfecta estricta negativa;
si p est entre 0 y 1 hay asociacin positiva;
si p est entre 1 y 0 hay asociacin negativa.
Riesgo relativo
1| 1
1| 2
1
1
p
RR
p

Propiedades
1 RR hay independencia = ;
0 RR APIT II = ;

1| 1 2 | 2
si 0, 0 p p hay asociacin perfecta estricta negativa = = ;

1| 2
si 0 p RR no est definido = ,
Estimacin muestral de riesgo relativo:

11 2
21 1
n n
RR
n n
=
i
i
Se puede utilizar una transformacin del riesgo relativo como medida de asociacin:

11 12
1 2
0, 5 0, 5
ln ln ln
0, 5 0, 5
n n
RR
n n
| | | | + +
=
| |
| |
+ +
\ . \ .
i i
El riesgo relativo en estudios de cohortes o en ensayos clnicos.
Se trata de calcular el riesgo observado en los expuestos y relativizarlo respecto al riesgo de los que no
estaban expuestos.
Los sujetos se clasifican entre expuestos y no expuestos y posteriormente se observa si presentan o no
una determinada enfermedad.
Dada la siguiente tabla:
17
enfermedad
si no total
si a
b
a + b
expuestos
no c
d
c + d
a
riesgo en expuestos a b
RR
c
riesgo en no expuestos
c d
+
= =
+
En los estudios que implican un seguimiento (cohortes y ensayos clnicos) el riesgo es equivalente a la tasa
de incidencia acumulada.
Por ejemplo: una cohorte de 1.249 nios es seguida durante 14 aos. Se quiere saber si hay relacin entre
presentar episodios de bronquitis en los primeros 5 aos de vida (exposicin) y presentar tos a los 14 aos
(enfermedad).
tos a los 14 aos
si no total
si 26
247
273
bronquitis a
los cinco aos
no 44
1002
1046
26
0, 95
273
2, 26
44
0, 042
1046
riesgo en expuestos
RR
riesgo en no expuestos
= = = =
Los nios con antecedentes de bronquitis antes de los 5 aos tienen 2,26 veces ms riesgo de padecer tos
a los 14 aos que nios sin estos antecedentes.
Intervalo de confianza de un RR
A partir de los datos observados en una muestra de sujetos, se trata de estimar cual puede ser el RR en la
poblacin. Esta estimacin se realiza por intervalo con un determinado nivel de confianza.
Cuando los efectivos en cada una de las casillas son mayores de 5 la frmula para el clculo de intervalo de
confianza IC es:
( )
( )
( )
2
1 1 1 1
ln
1 100
RR z
a a b c c d
IC e

+ + +
+ +
=
Para los datos del ejemplo y si desea calcular el intervalo de confianza del 95 %:
( )
( )
1 1 1 1
ln 2,26 1,96
26 273 44 1046
1 0, 05 100 1, 42 3, 61 IC e
+ + +
= =
8.3. Medidas de asociacin en tablas I x J
8.3.1. Medidas basadas en la
2
de Pearson
Coeficiente
2
de Pearson
Valor poblacional:
( )
2
2
1 1
1
I J
i j i j
i j
i j
P P P
n P P
= =

=

i i
i i
18
Valor estimado:
( )
2
2
2
1 1

I J
i j i j
i j
i j
n m
n m n
= =


= =

Propiedades:
vale 0 si hay independencia;
vale 1 en la asociacin perfecta estricta;
en tablas 2 x 2 el valor de coincide con
2
r , es simtrico y fcil de calcular.
8.4. Medidas de asociacin en tablas I x J
Coeficiente de contingencia
Valor poblacional:
2
2
1
C

=
+
Valor estimado:
2
2
1
n
C
n

+
Propiedades:
Si C vale cero hay independencia;
No alcanza su valor mximo an cuando hay asociacin perfecta: ste depende del tamao de la tabla.
Para tablas cuadradas el valor mximo que puede tomar es:
max
1 I
C
I

=
donde: I es el nmero mas bajo de filas o columnas.
En la prctica se utiliza el estadstico ajustado:
max
*
A
C
C C
C
= =
o coeficiente ajustado de Pearson o de Sakoda independientemente del tamao de la tabla.
La significacin de C es la misma que la de
2
.
C y * C son medidas simtricas.
Coeficiente T de Tschuprov
Valor poblacional:
( ) ( )
2
1 1
T
I J

=

Valor estimado:
( ) ( )
2

1 1
T
n I J

=

Propiedades:
19
T vale 0 cuando hay independencia;
T vale 1 en caso de asociacin perfecta estricta en tablas 2 x 2;
La significacin de T es la misma que la de
2
.
T es una medida simtrica
Coeficiente V de Cramer
Es la ms popular de las medidas de asociacin nominal basadas en ji-cuadrado variando de 0 a 1
independiente del tamao de la tabla cuando las filas marginales son iguales a las columnas marginales
Valor poblacional
2
V
m

=
donde ( ) ( ) { }
min 1 , 1 m I J = , la cantidad ms pequea de (columnas-1) o (filas-1)
Valor estimado:
2

V
nm

=
Propiedades:
V vale 0 si hay independencia;
En la asociacin perfecta, V alcanza su valor mximo;
En tablas cuadradas el valor de V coincide con T ;
En tablas 2 x 2
2
V r = .
8.4.2. Medidas basadas en la reduccin proporcional del error (RPE)
Son medidas de asociacin que expresan la proporcin en que se consigue reducir la probabilidad de
cometer un error de prediccin cuando, al intentar clasificar un caso o grupo de casos como pertenecientes
a una u otra categora de una variable, en lugar de utilizar nicamente las probabilidades asociadas a cada
categora de esa variable, se efecta la clasificacin teniendo en cuenta las probabilidades de las categoras
de esa variable en cada categora de una segunda variable.
Considrese los factores A y B . Se quiere determinar en qu nivel del factor B se clasificar a un
individuo elegido al azar. Esta prediccin se puede hacer de dos formas:
arbitrariamente, si se considera el nivel del factor A en que se clasifica el individuo. (
1
P = probrabilidad
de cometer error prediciendo arbitrariamente);
predecir el nivel de B , teniendo en cuenta el nivel de A en que est clasificado. (
2
P

= probabilidad de
cometer error prediciendo de esta forma).
Si A y B son independientes, entonces
1 2
P P = .
Si existe asociacin,
1 2
P P < .
Se define la medida de la siguiente forma:
1 2
1
P P
RPE
P

=
Interpretacin de estas medidas.
Estn entre
| |
0,1 ;
Si los factores son independientes
1 2
P P = y la medida vale 0;
Si la medida vale 0 puede existir asociacin entre los factores;
20
Si los factores estn asociados,
1 2
P P > y la medida est entre 0 y 1;
Si los factores estn perfectamente asociados vale 1;
Son medidas asimtricas y se definen simtricas de la misma forma.
Coeficiente Lambda de Goodman y Kruskal.
La medida de asociacin lambda parte de la siguiente idea: si al predecir a qu categora de una
determinada variable X pertenece un caso se dice que pertenece a la categora ms probable de todas, se
estar cometiendo un error de prediccin igual a la probabilidad de pertenecer a una cualquiera de las
restantes categoras. Si, en lugar de esto, se clasifica a ese caso en otra categora de la variable X
dependiendo de que a que categora de una segunda variable ( ) m Y pertenece, se puede estar
consiguiendo una reduccin en el error de prediccin (lo cual ocurrir si las dos variables estn
relacionadas). El coeficiente lambda expresa la proporcin de error de prediccin que se consigue reducir al
proceder de esta segunda manera.
Lambda tiene tres versiones: dos asimtricas (para cuando una de las dos variables se considera
independiente y la otra dependiente) y una simtrica ( para cuando no existen razones para distinguir entre
variable dependiente e independiente). El programa SPSS incluye las tres versiones.
Poblacionalmente toma el valor:
( )
1
|
1 1
1
I
m i m
i
B A
m
P P
P
=
| |

|
\ .
=

i
i
donde
( )
max
m j
P P =
i i
;
( )
max
i m i j
P P = .
Propiedades:
es indeterminado si 1
m
P =
i
;
si est entre 0 y 1;
si A y B son independientes entonces vale 0;
si vale 0 indica ausencia de capacidad predictiva de A para B;
si vale 1 indica asociacin perfecta estricta o implcita de tipo I;
es invariante frente a permutacin de filas o columnas.
Valor muestral:
1
|

I
i m m
i
B A
m
n n
n n
=

=

i
i
Hay una versin simtrica para cuando no sea posible determinar qu factor es el explicativo y cual es el
explicado:
1 1

2
I J
i m m j m m
i j
m m
n n n n
n n n
= =
+
=

i i
i i
Coeficiente de inertidumbre (Theil, 1970)
Al igual que lambda, el coeficiente de incertidumbre es una medida de asociacin basada en la reduccin
proporcional del error. Por tanto, es una medida que expresa el grado de incertidumbre que se consigue
reducir cuando se utiliza una variable para efectuar pronsticos sobre otra.
Posee dos versiones asimtricas (dependiendo de cual de las dos variables se considere dependiente) y
una simtrica (para cuando no se hacen distinciones entre variable independiente y dependiente).
21
Se obtiene de la siguiente manera:
( ) ( ) ( )
( )
| Y X
I X I Y I X Y
I
I Y
+
=
donde: ( )
1
ln
I
i i
i
n n
I X
n n
=
| |
=
|
\ .

;
( )
1
ln
J
j j
j
n n
I Y
n n
=
| |
=
|
\ .

;
( )
1 1
ln
I J
i j i j
i j
n n
I X Y
n n
= =
| |
=
|
\ .

;
i
n es la frecuencia marginal de las filas;
j
n es la frecuencia marginal de las columnas;
i j
n es la frecuencia marginal de las casillas
( )
0
i j
n > ;
Para obtener
| X Y
I basta con intercambiar los papeles de ( ) I X e ( ) I Y . Y la versin simtrica se obtiene
multiplicando
| X Y
I por 2 despus de aadirle ( ) I X al denominador.
8.4.3. Medidas de asociacin en tablas I x J de tipo ordinalordinal basadas en concordancia
discordancia
Un par de individuos se dice concordante si el individuo que se encuentra clasificado en un nivel superior de
uno de los factores, es clasificado tambin en un nivel superior para el segundo factor.
Un par se dice discordante si el individuo que se clasifica en el nivel superior de un factor, est clasificado
en un nivel inferior para el segundo factor.
Un par se dice ligado si ambos tienen igual clasificacin en ambos factores.
Dado un par elegido aleatoriamente la probabilidad de concordancia es:
2
i j k l
k i l j
P P
> >

.
La probabilidad de discordancia es:
2
i j k l
k i l j
P P
> <

.
En una tabla de contingencia se definen dichas probabilidades como:
Concordancia: 2
i j k l D
i j k i l j
P P P
> >
=

Discordancia: 2
i j k l D
i j k i l j
P P P
> <
=

Nmero de pares concordantes:
1 1
I J
i j k l
i j k i l j
n P C
= = > >
=

Nmero de pares discordantes:
1 1
I J
i j k l
i j k i l j
n n D
= = > <
=

Nmero de pares ligados por el factor A:
.
1
2
I
i
A
i
n
T
=
| |
=
|
\ .

22
Nmero de pares ligados por el factor B:
.
1
2
J
j
B
j
n
T
=
| |
=
|
\ .

1 1
2
I J
i j
AB
i j
n
T
= =
| |
=
|
\ .

El total de pares es
A B AB
C D T T T + + + .
Coeficiente Gamma de Goodman y Kruskal

C D
C D

=
+
donde C es el nmero de pares concordantes; y
D es el nmero de pares discordantes.
Propiedades:
est entre 1 y 1;
en caso de independencia vale 0;
si hay asociacin perfecta negativa vale 1;
si hay asociacin perfecta positiva vale 1;
es una medida simtrica;
cuanto ms cercano sea el valor de a 1 mayor asociacin positiva;
En tablas 2 x 2 coincide con Q de Yule.
El coeficiente gamma puede ser computado incluso cuando en las clulas de recuento aparece el valor cero
o menor, pero no puede ser computada si todos los casos son una simple columna o una simple fila.
Coeficiente d de Somers
Es el coeficiente gamma modificado para penalizar los pares ligados en X , en hiptesis direccional
(asimtrica) en la cual la X es la causa de predecir la Y ; y para penalizar los pares ligados en Y
solamente, en la hiptesis en la cual Y es la causa de predecir la X .
La d de Somers para la hiptesis en la que X causa o predice la Y , viene dada por la frmula:
0
Y X
C Q
d
C Q A

=
+ +
Para la hiptesis en la que Y causa o predice la X la frmula es:
0
X Y
C Q
d
C Q B

=
+ +
donde C es el nmero de pares concordantes;
D es el nmero de pares discordantes;
0
B es el nmero de pares ligados en X ;
0
A es el nmero de pares ligados en Y .
Versin simtrica:
( )
|
0 0

1
2
B A
C D
d
C D A B

=
+ + +
23
La d de Somers es un estadstico asimtrico, pero puede hacerse simtrico simplemente promediando
| X Y
d y
| Y X
d .
La d de Somers simtrica es 1 solamente cuando ambas variables son funciones montonas estrictas de la
otra
La d de Somers se usa con datos ordinales
En tablas de 2 x 2, la d de Somers es equivalente a una diferencia de porcentaje. Para una tabla dada, la
d de Somers ser menos que o igual a gamma o
c
(tau-c).
Para tablas cuadradas,
b
(tau-b) es la media geomtrica entre
| X Y
d y
| Y X
d .
Coeficiente de Wilson
0 0

C D
C D A B

=
+ + +

Si
0
0 A = coincide con
|

B A
d ;
Si
0
0 B = coincide con
|

A B
d ;
Si ambos son cero coincide con Gamma.
8.4.4. Medidas basadas en correlacin por rangos
Para variables de tipo ordinal, el rango es el lugar que ocupa el valor de la variable entre todos ordenados
de menor a mayor.
Coeficiente de correlacin por rangos de Kendall
Hay tres grupos:
(a)
a
de Kendall
Ambos factores tienen el mismo nmero de categoras y los mismos totales marginales.
( ) 1
2
a
C D
n n

Propiedades
Su valor est entre 1 y 1;
Si hay independencia su valor es 0;
Si asociacin positiva perfecta vale 1;
Si asociacin negativa perfecta vale 1.

(b)
b
de Kendall
( ) ( )
0 0
b
C D
C D A C D B

=
+ + + +
Est basado en el nmero de concordancias, discordancias y empates entre pares de casos. Un par es
concordante si los valores de ambas variables para un caso son menores/mayores que los valores
correspondientes para el otro caso, y discordante si ocurre lo contrario.
El coeficiente
b
de Kendall puede tomar valores entre 1 y 1, aunque solo alcanza estos extremos en el
caso de tablas cuadradas. Si el predominio de los pares es prximo a 1 y se dice que la asociacin es
positiva; si la mayora de los pares es discordante, la asociacin ser negativa y el valor se acercar a 1. El
24
valor 0 indica que no hay relacin entre las dos variables y ocurre cuando los pares concordantes y
discordantes son igualmente probables.
b
es un coeficiente no direccional y requiere datos binarios u ordinales
(c)
c
de Stuart o de Kendall-Stuart
Es una variante del coeficiente anterior, y se diferencia de l en que puede alcanzar los valores mnimo y
mximo, 1 y 1, en tablas de cualquier dimensin, salvo pequeas discrepancias cuando el tamao de la
muestra no es un mltiplo del mnimo entre M (nmero de filas) y N (nmero de columnas)
respectivamente:
( )
( )
2
2
1
c
m C D
n m

=

donde m es el valor mas pequeo del correspondiente al nmero de filas o columnas.


El coeficiente
c
est diseado para usar cuando al menos una de las dos variables es ordinal. Puede
usarse con datos de mas alto nivel pero se considera ineficiente para estos propsitos.
8.4.5. Coeficiente de concordancia kappa de Cohen
En cualquier estudio de investigacin una cuestin clave es la fiabilidad de los procedimientos de medida
empleados. Como seala Fleiss en el contexto de los estudios clnicos, ni el ms elegante de los diseos
sera capaz de paliar el dao causado por un sistema de medida poco fiable. Tradicionalmente se ha
reconocido una fuente importante de error de medida en la variabilidad entre observadores.
Consecuentemente, un objetivo de los estudios de fiabilidad debe consistir en estimar el grado de dicha
variabilidad. En este sentido, dos aspectos distintos entran a formar parte tpicamente del estudio de
fiabilidad: de una parte, el sesgo entre observadores dicho con menos rigor, la tendencia de un observador
a dar consistentemente valores mayores que otro y de otra, la concordancia entre observadores es decir,
hasta qu punto los observadores coinciden en su medicin. Cindose a este segundo aspecto, la manera
concreta de abordar el problema depende estrechamente de la naturaleza de los datos: si stos son de tipo
continuo es habitual la utilizacin de estimadores del coeficiente de correlacin intraclase, mientras que
cuando se trata de datos de tipo categrico el estadstico ms empleado es el coeficiente kappa ( ) .
El coeficiente kappa
Supngase que dos observadores distintos clasifican independientemente una muestra de n tems en un
mismo conjunto de C categoras nominales. El resultado de esta clasificacin se puede resumir en una
tabla como la tabla I, en la que cada valor
i j
x representa el nmero de tems que han sido clasificados por
el observador 1 en la categora I y por el observador 2 en la categora J .
observador 2
observador 1 1 2 C total
1 11
x
12
x

1C
x
1
x
i
2 21
x
22
x

2C
x
2
x
i



C 1 C
x
2 C
x

CC
x
C
x
i
total 1
x
i 2
x
i

C
x
i
n
Tabla I. Formato de los datos en un estudio de concordancia.
25
Por ejemplo, imagnese dos radilogos enfrentados a la tarea de categorizar una muestra de radiografas
mediante la escala: anormal, dudosa, normal. La tabla II muestra un conjunto de datos hipotticos para
este ejemplo, dispuesto de acuerdo con el esquema de la tabla I.
radilogo 2
radilogo 1
anormal dudosa normal total
anormal 18 4 3 25
dudosa 1 10 5 16
normal 2 4 53 59
total 21 18 61 100
Tabla II. Datos hipotticos de clasificacin de una muestra de 100 radiografas por dos radilogos.
Desde un punto de vista tpicamente estadstico es ms adecuado liberarse de la muestra concreta (los n
tems que son clasificados por los dos observadores) y pensar en trminos de la poblacin de la que se
supone que ha sido extrada dicha muestra. La consecuencia prctica de este cambio de marco es que se
debe modificar el esquema de la tabla I para sustituir los valores
i j
x de cada celda por probabilidades
conjuntas, identificadas como
i j
(tabla III).
observador 2
observador 1 1 2 C marginal
1 11

1 2


1C

i
2 2 1

2 2


2 C




C 1 C

2 C


C C

i
marginal 1

i 2

i

C

i
1
Tabla III. Modificacin del esquema de la tabla I cuando se consideran las probabilidades de cada resultado.
Con el tipo de esquematizacin que se ha propuesto en las tablas I III es evidente que las respuestas que
indican concordancia son las que se sitan sobre la diagonal principal. En efecto, si un dato se sita sobre
dicha diagonal significa que ambos observadores han clasificado el tem en la misma categora del sistema
de clasificacin. De esta observacin surge naturalmente la ms simple de las medidas de concordancia a
considerar, la suma de las probabilidades a lo largo de la diagonal principal. Simblicamente, si se denota
dicha medida por
0
, ser:
0
1
C
i i
i =
=

Como es obvio, se cumple que


0
0 1 , correspondiendo el valor 0 a la mnima concordancia posible y
el 1 a la mxima.
Aunque este sencillo ndice ha sido propuesto en alguna ocasin como medida de concordancia de
eleccin, su interpretacin no est exenta de problemas. La tabla IV ilustra el tipo de dificultades que
26
pueden surgir. En el caso A,
0
0, 2 = , luego la concordancia es mucho menor que en el caso B , donde
0
0, 8 = . Sin embargo, condicionando por las distribuciones marginales se observa que en el caso A la
concordancia es la mxima posible, mientras que en el B es la mnima.
A B
observador 2 observador 2
observador 1 1 2 marginal observador 1 1 2 marginal
1 0,1 0,8 0,9
1 0,8 0,1 0,9
2 0 0,1 0,1
2 0,1 0 0,1
marginal 0,1 0,9 1
marginal 0,9 0,1 1
Tabla IV. Ejemplos de concordancia
Por lo tanto, parece claro que la bsqueda se debe orientar hacia nuevas medidas de concordancia que
tengan en cuenta las distribuciones marginales, con el fin de distinguir entre dos aspectos distintos de la
concordancia, a los que se podra aludir informalmente como concordancia absoluta o relativa. El ndice
(kappa) representa una aportacin en esta direccin, bsicamente mediante la incorporacin en su frmula
de una correccin que excluye la concordancia debida exclusivamente al azar correccin que, como se
ver, est relacionada con las distribuciones marginales.
Con la notacin ya empleada en la tabla III, el ndice se define como
1 1 1
1 1
1
C C C
i i i i
i i i
C C
i i
i i
= = =
= =

=



Ecuacin 1
Es instructivo analizar la expresin anterior. Obsrvese en primer lugar que si se supone la independencia
de las variables aleatorias que representan la clasificacin de un mismo tem por los dos observadores,
entonces la probabilidad de que un tem sea clasificado por los dos en la misma categora i es
i i

i
. Por lo
tanto, si se extiende el sumatorio a todas las categoras,
i i

i
es precisamente la probabilidad de que
los dos observadores concuerden por razones exclusivamente atribuibles al azar. En consecuencia, el valor
de es simplemente la razn entre el exceso de concordancia observado ms all del atribuible al azar
( )
i i i i

i
y el mximo exceso posible
( )
1
i i

i
.
La mxima concordancia posible corresponde a 1 = . El valor 0 = se obtiene cuando la concordancia
observada es precisamente la que se espera a causa exclusivamente del azar. Si la concordancia es mayor
que la esperada simplemente a causa del azar, 0 > , mientras que si es menor, 0 < . El mnimo valor
de depende de las distribuciones marginales.
En el ejemplo de la tabla IV, vale 0,024 en el caso A y 0,0216 en el B , lo que sugiere una
interpretacin de la concordancia opuesta a la que sugiere el ndice
0
(vide supra). Para comprender
resultados paradjicos como stos, conviene recordar los comentarios que se hacan anteriormente acerca
de las limitaciones del ndice
0
.
A la hora de interpretar el valor de es til disponer de una escala como la siguiente, a pesar de su
arbitrariedad:
27
valor de k fuerza de la concordancia
< 0,20 pobre
0,21 0,40 dbil
0,41 0,60 moderada
0,61 0,80 buena
0,81 1,00 muy buena
Tabla V. Valoracin del ndice .
A partir de una muestra se puede obtener una estimacin, k , del coeficiente simplemente reemplazando
en la ecuacin 1 las probabilidades por las proporciones muestrales correspondientes:
1 1 1
2
1
1
1
C C C
i i i i
i i i i
i i i
C
C
i i
i i
i
i
x x x
n x x x
n n n
k
x x
n x x
n n
= = =
=
=
| | | || |

| | |
\ . \ .\ .
= =
| || |

| |
\ .\ .

Ecuacin 2
Con los datos de la tabla II se obtiene aplicando esta frmula un valor de 0, 66 k = , que segn nuestra
convencin anterior se calificara como una buena concordancia.
Contrastes de hiptesis e intervalos de confianza
La obtencin de una simple estimacin puntual del valor de no proporciona ninguna indicacin de la
precisin de dicha estimacin. Desde el punto de vista de la estadstica inferencial es esencial conocer la
variabilidad de los estimadores y emplear ese conocimiento en la formulacin de contrastes de hiptesis y
en la construccin de intervalos de confianza.
Fleiss, Cohen y Everitt dan la expresin de la varianza asinttica es decir, para muestras infinitamente
grandes del estimador k , cuando el verdadero valor de es cero:
( )
( )
2
1 1 1
2
0 2
1
1
C C C
i i i i i i i i
i i i
C
i i
i
k
n
= = =
=
| |
+ +
|
\ .
=
| |

|
\ .

Ecuacin 3
Reemplazando las probabilidades tericas, que se desconocen, por las proporciones muestrales, se obtiene
un estimador de ( )
2
0
k que se denota por ( )
2
0
s k :
( )
( )
2
1
1 1 2
0 2
2
1
C
i i
C C
i
i i i i i i
i i
C
i i
i
x x
n x x x x x x
n
s k
n x x
=
= =
=
| |
|
\ .
+ +
=
| |

|
\ .

Ecuacin 4
Se puede emplear este resultado para contrastar la hiptesis nula de que es cero frente a la alternativa
de que no lo es, utilizando como estadstico del contraste el cociente:
( )
0
k
s k
Ecuacin 5
donde k denota el valor absoluto de k .
28
Y comparando su valor con los cuantiles de la distribucin normal estndar. Con los datos de la tabla II,
0, 6600 k = y ( )
2
0
0, 0738 k = , luego:
( )
0
8, 9441
k
k
=

y como
0,975
1, 96 z = , se concluye que, al nivel de significacin 0, 05 = , el valor de k es significativo y
lleva a rechazar que sea cero.
Es discutible la utilidad del contraste de hiptesis anterior, ya que como en general es razonable esperar
cierto grado de concordancia ms all del azar, se encontrar trivialmente con un resultado significativo.
Para poder realizar contrastes de hiptesis ms interesantes es necesario conocer la expresin de la
varianza asinttica cuando no se supone que es cero. La expresin es sensiblemente ms compleja que
la [3]:
( )
( )( ) ( )( )( ) ( ) ( )
( )
2 2
2
1 1 2 1 2 1 2 3 2 4 2
2
4
2
1 1 2 1 1 2 1 4
1
T T T T T T T T T T T
k
T n
+ +
=

Ecuacin 6
Donde:
1
1
C
i i
i
T
=
=

2
1
C
i i
i
T

=
=
i i
( )
3
1
C
i i i i
i
T
=
= +
i i
( )
2
4
1 1
C C
i i i i
i i
T
= =
= +
i i
Se puede demostrar que cuando es cero la ecuacin [6] se reduce
a la [3]. Para contrastar la hiptesis nula de que es igual a un valor dado
0
frente a una alternativa
bilateral, se procede como en el caso 0 = , slo que empleando como estadstico del contraste:
( )
0
k k
s k

Ecuacin 7
donde ( ) s k ahora es la raz cuadrada de ( )
2
s k , el estimador de ( )
2
k obtenido sustituyendo en [6]
probabilidades por proporciones muestrales. Es obvio que el caso 0 = explicado con anterioridad no es
ms que un caso particular de este contraste, con una mejor estimacin del error estndar.
Volviendo al ejemplo de la tabla II, para contrastar la hiptesis de que el verdadero valor de es
0
0, 7 = ,
como 0, 6600 k = y ( ) 0, 0677 s k = , se calcula:
( )
0
0,975
0, 5908 1, 96
k k
z
s k

= < =
Por tanto, al nivel de significacin 0, 05 = , no hay suficiente evidencia para rechazar la hiptesis nula.
Desde el punto de vista inferencial, un enfoque ms verstil que el del contraste de hiptesis consiste en dar
intervalos de confianza para el verdadero valor de . Tomados simultneamente, k y el intervalo de
confianza dan, adems de la mejor estimacin de , una medida del error que se comete con esa
estimacin. Un intervalo de confianza aproximado del ( ) 1 100% , construido por el mtodo estndar, es
de la forma:
29
( ) ( )
2 2
1 1
, k z s k k z s k


(
+

donde
2
1
z

es el percentil de orden
( )
1 100
2

de la distribucin normal estndar. Con los datos de la


tabla II, el intervalo de confianza del 95 % para sera
| |
0, 5273 , 0, 7927 . Se observa como los valores
0 y 0,7 considerados en los contrastes anteriores, quedan respectivamente fuera y dentro del intervalo, un
hecho que ilustra la equivalencia entre los dos enfoques: contraste de hiptesis y estimacin por intervalos.
Coeficiente kappa ponderado
En el caso particular de que la variable de anlisis tenga categoras que representen una clasificacin
nominal, el coeficiente descrito slo tiene en consideracin si hay o no acuerdo entre observadores y
considera con el mismo peso situaciones que podran resultar muy distintas. Por ejemplo, supngase que
dos observadores clasifican los defectos de un producto en: muy grave, grave, leve o sin importancia.
A la hora de analizar si hay o no acuerdo entre las opiniones, si uno de los observadores clasifica como sin
importancia y el otro como leve, se considera de igual forma que si uno clasifica como muy grave y el
otro como sin importancia.
El llamado coeficiente ponderado tiene en cuenta este acuerdo aproximado; para ello, a las celdas de
acuerdo total (situadas en la diagonal principal de la tabla), se les asigna un peso 0, mientras que a las
celdas de los ngulos extremos de la tabla, la ponderacin mxima. En general, la frmula para hallar el
coeficiente ponderado es:
0 ,
1
,
1
1
C
i j i j
i
p C
i j e i j
i
w p
w p
=
=

donde
0 i j
p es la proporcin observada de la posicin i j ; y
e i j
p la proporcin esperada de acuerdo, de la celda i j .
i j
w es el peso asignado a la celda i j . En principio, el peso otorgado a cada grado de
discrepancia es arbitrario pero lo ms habitual es usar como esquema de ponderacin los
pesos cuadrticos (basados en el cuadrado de la discrepancia), ( )
2
i j
w i j = , que hace
que los elementos de la diagonal tengan peso cero y aumenten de valor a medida que se
alejan de la diagonal.
Ejemplo
Supngase que dos gerentes de Recursos Humanos provenientes de dos empresas que se fusionaron,
entrevistan a 50 aspirantes y les efectan una serie de tests y preguntas, a partir de las cuales clasifican al
aspirante segn cuatro categoras: A, B , C o D. Estas categoras se establecieron de acuerdo con la
puntuacin que coloc cada profesional, teniendo en cuenta lo siguiente: edad del aspirante, nmero de
materias aprobadas (si era estudiante), nmero de aos desde que sali de la facultad (si era graduado),
nmero de aos de experiencia laboral, rendimiento en la prueba de oposicin y calificacin en un examen
general. Sobre los 50 aspirantes se analiz el grado de concordancia de los gerentes de Recursos
Humanos en la seleccin. Los valores de la tabla indican nmero de aspirantes calificados segn cada
categora por ambos evaluadores:
A B C D
A 10 3 2 0 15
B 0 7 2 1 10
C 1 0 3 2 6
D 1 2 4 12 19
12 12 11 15 50
Tabla VI
30
Para hallar el coeficiente no ponderado, se calcula:
0
10 7 3 12
0, 64
50
nmero de acuerdos
p
nmero de acuerdos nmero de desacuerdos
=
+
+ + +
= =
Para hallar el coeficiente no ponderado, se calcula:
15 12 10 12 6 11 19 15
0, 2604
50 50 50 50 50 50 50 50
0, 64 0, 2604
0, 5132
1 0, 2604
e
p = + + + =

= =

Segn la valoracin del coeficiente, el grado de acuerdo debera clasificarse como moderado.
Para hallar el coeficiente ponderado, asignando valores de peso cuadrticos, la tabla con los valores
observados y los pesos de cada celda es:
A B C D
A 10
0
3
1
2
4
0
9
15
B 0
1
7
0
2 1 1
4
10
C 1
4
0
1
3
0
2
1
6
D 1
9
2
4
4
1
12
0
19
12 12 11 15 50
Tabla VII.
0
1
3 2 2 1 1 2 1 2 4
1 4 1 4 4 1 9 4 1 0, 88
50 50 50 50 50 50 50 50 50
C
i j i j
i
w p
=
= + + + + + + + + =

Las proporciones esperadas de cada celda y los pesos se detallan en la siguiente tabla:
A B C D
A 3,6
0
3,6
1
3,3
4
4,5
9
15
B 2,4
1
2,4
0
2,2 1 3
4
10
C 1,44
4
1,44
1
1,32
0
1,8
1
6
D 4,56
9
4,56
4
4,18
1
5,7
0
19
12 12 11 15 50
Tabla VIII
1
3, 6 3, 3 4, 5 2, 4 2, 2 3
1 4 9 1 1 4
50 50 50 50 50 50
1, 44 1, 44 1, 8 4, 56 4, 56 4,18
4 1 1 9 4 1
50 50 50 50 50 50
2, 9272
C
i j ei j
i
w p
=
= + + + + + +
+ + + + + + =
=

31
0
1
1
0, 88
1 1 0, 6993
2, 9272
C
i j i j
i
p C
i j ei j
i
w p
w p
=
=
= = =

Teniendo en cuenta los factores de ponderacin, el grado de acuerdo debera considerarse bueno.
Consideraciones respecto del coeficiente kappa
La gran utilizacin del coeficiente de concordancia , sobre todo en problemas asociados a las ciencias
mdicas, se debe probablemente a la facilidad de clculo, a la mejora que supone con respecto al
porcentaje de concordancia observado y a su clara interpretacin. Sin embargo, tiene algunos problemas y
limitaciones.
El principal problema de esta medida de concordancia radica en que est pensada para clasificaciones
nominales, en las que no existe un orden de graduacin entre diferentes categoras; por lo tanto, valora
igual una discrepancia severa que una discrepancia despreciable. Adems, cuanto mayor es el nmero de
categoras, menor es la probabilidad de obtener concordancia exacta. En consecuencia, el coeficiente
depende sensiblemente del nmero de categoras, ya que disminuye conforme aumenta el mismo. Por ello,
cuando haya ms de dos categoras puede ser conveniente comparar cada una de ellas (concordancia
especfica) con la unin de las dems.
El coeficiente ponderado, si bien resuelve en principio el problema del acuerdo exacto, plantea un nuevo
problema: el de la eleccin de las ponderaciones. Si stas se eligen arbitrariamente, se dificulta la
comparacin; si, por el contrario, la ponderacin se hace por pesos cuadrticos, entonces el coeficiente
es menos sensible a los cambios en el nmero de categoras y tiende a aumentar, ms que a disminuir, si
se agregan ms categoras.
Recomendaciones
Debe tenerse en cuenta que el acuerdo observado (concordancia bruta) est afectado por el azar y por
la distribucin de los valores en las celdas;
Es insuficiente presentar un nico coeficiente o ndice; se recomienda la presentacin de los datos;
Es aconsejable presentar, junto al ndice , sus valores mnimo y mximo, tal como sugieren Lantz y
Nebenzahl;
Las soluciones para los desacuerdos inter e intra observadores deben buscarse en la estandarizacin
de las mediciones y las reuniones de consenso sobre observaciones clnicas. El conocimiento sobre el
origen de los errores ayuda en este proceso. Si la concordancia no puede aumentarse con estas
estrategias, la solucin puede conseguirse a travs de las medidas mltiples. Dependiendo de cual sea
la principal fuente de desacuerdo, las medidas deben realizarse por diferentes o por el mismo
observador.
8.5. Inferencia en las medidas de asociacin
A partir de las medidas muestrales se intentar establecer el valor de las medidas poblacionales mediante
inferencia.
Una medida de asociacin es una funcin f sobre un espacio de vectores asociados a una tabla de
contingencia I J .
El objetivo es proporcionar, basndose en la informacin muestral, un intervalo de confianza para el valor
poblacional de la medida. Mediante el teorema central del lmite, bajo muestreo multinomial completo, el
vector de proporciones muestrales tiene distribucin asinttica normal multivariante con vector de medidas
P . Aunque interesa ( ) f p . Se utiliza el mtodo delta:
( ) ( )
2
2 2 2
1 1
1
C C
i i i i
i i
f p p p
n
= =
| |
| |
|
=
|
|
\ .
\ .

donde
i
es el vector formado por las derivadas parciales de f respecto a cada P
i j
.
32
El intervalo de confianza es: ( ) ( ) ( ) ( )
2
1
f p z f p


9. Anlisis de tablas de contingencia de mas de dos variables cualitativas
Se denominan variables cualitativas a aquellas cuyo resultado es un valor o categora de entre un conjunto
finito de respuestas posibles. El gnero, el estado civil o el grupo sanguneo son ejemplos de variables
cualitativas. Cuando se analizan variables cualitativas es habitual representar en tablas las frecuencias de
casos observados para cada una de las diferentes categoras de las variables, las cuales se denominan
tablas de contingencia.
En la siguiente tabla se presenta un ejemplo de tabla de contingencia para dos variables: en las filas se
encuentra la variable estudios, clasificada segn tres categoras, y en las columnas se representan la
variable HTA
1
. Los datos corresponden a un conjunto de pacientes diabticos.
HTA II a IV
2
HTA I normal alta normal ptima total
sin estudios 30 117 94 49 11 301
1
er
grado 39 123 110 60 21 353
2 y 3
er
grado 11 35 58 39 24 167
total 80 275 262 148 56 821
Tabla IX
En este tipo de tablas habitualmente se desea conocer si existe asociacin entre las dos variables, o si por
el contrario se pueden considerar independientes. Dicho de otra forma, se desea saber si la proporcin de
casos para cada categora de una de las variables es independiente del valor que toma la otra variable. Con
los datos de la tabla IX se pretende interesa saber si la proporcin de sujetos en cada una de las categoras
de la variable hipertensin es diferente segn el nivel de estudios o si, por el contrario, se pueden
considerar independientes.
El razonamiento para contrastar si existe o no asociacin entre dos variables cualitativas se basa en calcular
cul seran los valores de frecuencia esperados para cada una de las celdas en el caso de que
efectivamente las variables fuesen independientes, y compararlos con los valores realmente observados. Si
no existe mucha diferencia entre ambos, no hay razones para dudar que las variables sean independientes.
En el ejemplo, la proporcin de pacientes con HTA nivel I en la muestra es
275
33, 5 %
821
=
Si las variables son independientes esta proporcin debiera mantenerse (al menos de forma aproximada) en
cada nivel de estudios. As como se tiene 167 pacientes con estudios de 2 o 3
er
grado, el nmero de
casos esperado con HTA nivel I es:
167 0.335 55, 9 =
mientras que el valor observado es slo 35.
De forma general la frecuencia esperada para cada una de las celdas, cumplindose la hiptesis de
independencia, se calcula multiplicando el total de la fila por el total de la columna correspondientes, y
dividindole por el tamao global.
El contraste estadstico ms utilizado para evaluar si las diferencias entre las frecuencias observadas y las
esperadas pueden atribuirse al azar, bajo la hiptesis de independencia, es el denominado
2
de Pearson:

1
Segn la clasificacin propuesta en el documento The VI report of the JNC on prevention, detection,
evaluation and treatement of high blood pressure.
2
Los niveles de HTA II a IV se han agrupado en una sola categora.
33
( )
2
2
1 1
I J
i j i j
i j
i j
F f
F
= =

=

donde
i j
F representa la frecuencia esperada para la celda situada en la fila I columna J ; y
i j
f representa la frecuencia efectivamente observada para esa celda.
En la hiptesis de independencia este estadstico se distribuye de forma aproximada segn una
2
con
( )( ) 1 1 I J grados de libertad, siendo I el nmero de filas y J el nmero de columnas.
El estudio de la asociacin entre dos variables cualitativas en ocasiones puede ser insuficiente, ya que la
presencia de una tercera variable puede modificar las conclusiones respecto a esa asociacin, e incluso
puede interesar evaluar la influencia de ms variables adicionales. En el ejemplo anterior si se calcula el
valor de
2
se obtiene 35,6, que con 8 grados de libertad corresponde a un valor de probabilidad de
0,00002, lo que indica que los datos obtenidos estn en clara contradiccin con la hiptesis de
independencia y por lo tanto se debe concluir, a partir de la evidencia de los datos, que existe asociacin
entre el grado de hipertensin y el nivel de estudios de los pacientes.
Sin embargo, por las caractersticas sociales del pas, se sabe que las personas de edad avanzada no
tienen el mismo perfil educativo que las ms jvenes, siendo en general su nivel de estudios inferior. Si, por
otro lado, la prevalencia de la hipertensin aumenta con la edad, pudiera ser que la asociacin
observada se explique porque en las categoras con nivel de estudios inferiores se encuentran ms
personas de edad avanzada, mientras que en las categoras con mayor nivel de estudios predominen las
personas jvenes. Por ello puede interesar incluir en el anlisis una tercera variable que recoja la edad del
paciente, y que va a clasificarse en los siguientes intervalos: hasta 50 aos, entre 50 y 64, entre 65 y 74,
ms de 74 aos.
Ahora con tres variables, hipertensin, estudios y edad, se va a analizar de forma conjunta la
asociacin entre dichas variables cualitativas.
9.1. Modelos log-lineales para tablas de contingencia
Se inicia el razonamiento a partir de una tabla para dos variables con I filas y J columnas. Llamando
i j

a la proporcin total de sujetos clasificados como i en las filas y j en las columnas, y


i +
a la proporcin
total de sujetos en la categora i para la variable filas (olvidando la otra variable, es decir juntando todas las
columnas) y
j +
a la proporcin total de sujetos en la categora j para la variable columnas (juntando
todas las filas). Como se ha visto anteriormente, bajo la hiptesis de independencia la proporcin de cada
celda se estima como:
i j i j + +
=
Y por lo tanto para estimar la frecuencia
i j
F se multiplicar por el tamao global N :
i j i j i j
F N N
+ +
= =
Tomando logaritmos:
ln ln ln ln
i j i j
F N
+ +
= + +
Llamando X a la variable representada en las filas, y Y a la variable correspondiente a las columnas,
puede reescribirse la frmula anterior, que representa el modelo matemtico para estimar la frecuencia de
cada celda en la hiptesis de independencia, como sigue:
ln
X Y
i j i j
F = + +
donde cada trmino se corresponde directamente con los de la frmula anterior.
En este modelo se puede introducir un tercer trmino para considerar la presencia de asociacin,
tenindose entonces un modelo en el que ya no se cumplira la hiptesis de independencia:
ln
X Y X Y
i j i j i j
F = + + +
34
Por lo tanto la hiptesis de independencia es equivalente a plantear
0
X Y
i j
=
Si se estuviera analizando tres variables, se aadira una tercera de nombre Z , y generalizar el modelo
anterior:
ln
X Y Z X Y X Z Y Z X Y Z
i j i j j i j i k j k i j k
F = + + + + + + +
Este tipo de modelos se conoce con el nombre de modelos log-lineales.
Antes de volver al ejemplo en el que se analizaban las variables hipertensin, nivel de estudios y edad,
se va a plantear otro ejemplo, tambin con 3 dimensiones, pero ms sencillo en cuanto al nmero de
categoras de cada variable, en la que se estudia la proporcin de mujeres admitidas en una determinada
Universidad frente a la proporcin de hombres:
no admitidos admitidos % admitidos total
hombre 1493 1198 45 2691
mujer 1278 557 30 1835
total 2771 1755 4526
Tabla X
3
Sobre la base de estos datos se plantea una demanda a la citada Universidad acusndola de sexista en las
pruebas de admisin, que parecen favorecer claramente a los hombres. Sin embargo, los responsables de
la Universidad presentaron los datos distribuidos por facultades (denominando a las diferentes facultades de
forma genrica con las letras A hasta F ):
hombres mujeres
total presentados % admitidos total presentadas % admitidas
A 825 62 108 82
B 560 63 25 68
C 325 37 593 34
D 417 33 375 35
E 191 28 393 24
F 373 6 341 7
total 2691 1835
Tabla XI
donde se puede ver que apenas hay diferencias en las tasas de admisin, salvo en la facultad A donde el
porcentaje de hombres admitidos es del 62 % y el de mujeres es del 82 %! Este es un claro ejemplo de
cmo la asociacin entre dos variables cualitativas resulta ser espuria cuando se considera los valores de
una tercera variable, situacin que se conoce como paradoja de Simpson y que tambin se puede dar en
variables cuantitativas.
Para analizar este tipo de tablas multidimensionales se utilizarn los modelos log-lineales planteados
anteriormente. Para tres variables , , X Y Z se pueden ajustar diferentes modelos a los datos:

3
Datos tomados del libro de Powers y Xie, correspondientes a un estudio realizado en la Universidad de
California-Berkeley (Bickel et al. 1975; Freedman, Pisani, and Purves 1978).
35
modelo
, , X Y Z
Todas las variables son
mutuamente independientes, X Y
son independientes, X Z son
independientes, Y Z son
independientes, no existiendo
asociacin entre ellas, por lo que el
modelo queda reducido a
ln
X Y Z
i j i j k
F = + + +
, X YZ
En este modelo slo se considera la
asociacin Y Z ., X es
independiente de las otras dos
variables
ln
X Y Z Y Z
i j i j k j k
F = + + + +
, X Y Y Z X es independiente de Z para
cada valor de Y
ln
X Y Z X Y Y Z
i j i j k i j j k
F = + + + + +
, , X Y Y Z X Z
Existe asociacin dos a dos entre
todas las variables, pero no se
considera asociacin conjunta entre
las tres, de tal manera que la
asociacin entre dos de las
variables es homognea, no
cambia, para cada nivel de la otra
variable.
ln
X Y Z X Y X Z Y Z
i j i j k i j i k j k
F = + + + + + +
X Y Z
Si el modelo anterior no se ajusta
bien a los datos quiere decir que
hay que considerar la asociacin de
las tres variables, de tal manera que
la asociacin entre dos de ellas no
es homognea cuando cambia el
nivel de la otra variable.
ln
X Y Z X Y X Z Y Z X Y Z
i j i j k i j i k j k i j k
F = + + + + + + +
Tabla XII
9.2. Seleccin del modelo
Se proceder a ajustar diferentes modelos a los datos y ver cul se adecua mejor a los valores observados.
Para contrastar dos modelos diferentes se utiliza el estadstico denominado cociente de verosimilitud
(likelihood ratio), que se calcula como:
( )
2
2 ln | G f f F =

donde: f es la frecuencia observada; y
F es la frecuencia esperada segn el modelo.
Este estadstico se distribuye segn una
2
en la hiptesis de que el modelo es correcto, con grados de
libertad que dependen de los parmetros utilizados para ajustar el modelo. En la salida de los programa de
estadstica ingleses se suele presentar tambin como deviance (desviacin respecto al modelo observado,
tambin conocido como modelo saturado, porque en l se incluyen todos los trminos de asociacin
posibles y se ajusta por tanto perfectamente a los datos observados). Valores elevados de
2
G reflejan un
mal ajuste del modelo a los datos, lo que corresponder a un valor de probabilidad bajo.
Ajustando diferentes modelos para nuestro ejemplo de admisin en la Universidad se obtienen los valores
recogidos en la siguiente tabla:
36
modelo G grados de libertad p
( ) , , S F A 2097,7 16 0,0000
( ) , S F A 877,1 11 0,0000
( ) , , S F A F 21,7 6 0,0014
( ) , , , S F A F S A 20,2 5 0,0011
Tabla XIII. S = sexo, F = facultad, A = admitido
El primer modelo, que supone independencia entre todas las variables, se ajusta muy mal a los datos
obtenidos en el estudio. En el segundo modelo, para el que la admisin A es independiente de las otras
variables, que s se consideran asociadas (sexo y facultad), el ajuste mejora considerablemente, y mucho
ms con el tercer modelo, aunque las diferencias de las frecuencias estimadas con respecto a las
observadas todava resultan estadsticamente significativas en el contraste
2
G frente al modelo saturado
( ) 0, 0014 p = .
Volviendo de nuevo al primer ejemplo, en el que se consideraban las variables E : edad, C : nivel
cultural y H : hipertensin, se calculan los estadsticos de ajuste correspondientes a diferentes modelos
posibles:
modelo G grados de libertad p
( ) , , E C H 232,2 50 0,0000
( ) , EC H 108,2 44 0,0000
( ) , H E C E 34,9 32 0,33
Tabla XIV
4
Puede verse como el modelo ( ) , H E C E se ajusta bastante bien a los datos ( ) 0, 33 p = , por lo que se
puede considerar que el nivel de hipertensin en la muestra no se asocia con el nivel cultural en cada grupo
de edad. De nuevo todo lo contrario de lo que se conclua si se consideraba nicamente las variables
hipertensin y nivel cultural.
9.3. Indice de discrepancia
Volviendo otra vez sobre el ejemplo de Admisin en la Universidad, puede verse en la tabla XIII que aunque
el modelo ( ) , , S F A F mejora considerablemente el ajuste frente al modelo de independencia de todas
las variables ( ) , , S F A , sin embargo sigue siendo estadsticamente significativo el contraste con respecto
al modelo saturado (frecuencias observadas). En este ejemplo se est trabajando con una muestra bastante
grande, de 4526 sujetos, y en estos casos puede ocurrir que diferencias de escasa importancia prctica, sin
embargo resulten estadsticamente significativas. Si se representaran los valores de frecuencias estimados
por este modelo y los observados, se vera que no hay grandes diferencias (no se presentan aqu para no
alargar la extensin de este artculo).
Buscando alguna otra alternativa para valorar el ajuste, se puede definir un ndice de discrepancia
(dissimilarity index):

4
Se ha designado a la variable estudios con la letra C , de nivel cultural, aunque no es lo mismo,
porque la letra E se ha reservado para edad.
37
1 1
2 2
N N
i i i
i i
f F p
ID
N
= =

= =

que corresponde a la media de las diferencias entre las frecuencias observadas y las previstas por el
modelo, en valor absoluto. Este ndice puede tomar valores entre 0 y 1, correspondiendo los valores ms
pequeos a un mejor ajuste del modelo a los datos. Tambin se puede interpretar como la proporcin de
casos a los que hay que cambiar la clasificacin para obtener un ajuste perfecto. Valores inferiores a 0,02 o
0,03 reflejan un buen ajuste.
En el ejemplo de admisin a la universidad, con el modelo ( ) , , S F A F en el que las variables sexo y
admisin son independientes para cada categora de la variable facultad, se obtiene un ndice de
discrepancia de 0,016; lo que quiere decir que con este modelo hay que cambiar la clasificacin de menos
del 2 % de los sujetos para obtener un ajuste perfecto; lo que ilustra claramente que en este ejemplo la
significacin estadstica est detectando diferencias entre el modelo y los datos de poca importancia
prctica, debido al gran tamao de muestra del estudio (4526 sujetos).
9.4. Comparacin entre dos modelos
Se puede comparar dos modelos log-lineales calculando la diferencia entre los valores de
2
G obtenidos, lo
que equivale al cociente de verosimilitud, y se distribuye aproximadamente como una
2
con grados de
libertad igual a la diferencia entre los grados de libertad de los modelos. As en el ejemplo de la admisin en
la Universidad, si se desea contrastar la existencia de diferencias significativas en el ajuste entre los
modelos ( ) , , S F A F y ( ) , , , S F A F S A con los datos de la tabla XIII se calcula:
( ) ( )
2 2
, , , 21, 7 20, 2 1, 5 G S F AF G S F AF S A = =
que para una
2
1
corresponde a un nivel de probabilidad de 0,22, y por lo tanto se puede concluir que no
existen diferencias significativas entre los ajustes logrados con ambos modelos.
9.5. Criterio Bayesiano de Informacin
Como se coment en el prrafo anterior, la utilizacin nicamente del valor de
2
G como medida de bondad
de ajuste favorecer, cuando el tamao de muestra sea grande, la eleccin de modelos complejos, con
muchos trminos de asociacin y no permitir distinguir entre una verdadera mejora del ajuste respecto de
una mejora trivial. Adems de la posibilidad de consultar el ndice de discrepancia, tambin se ha propuesto
utilizar el estadstico denominado criterio bayesiano de informacin (bayesian information criterion, BIC ).
La frmula para su clculo es la siguiente:
2
. . ln BIC G g l N =
Aunque no se va a profundizar en el razonamiento, se fundamenta en comparar la plausibilidad de dos
modelos frente a simplemente comparar las diferencias absolutas del ajuste. Cuando se comparan dos
modelos un valor inferior del BIC indica un mejor modelo segn ese criterio.
Si se repite la tabla XIII para el ejemplo de admisin en la Universidad, aadiendo una columna con el
BIC , se tiene:
modelo G grados de libertad p BIC
( ) , , S F A 2097,7 16 0,0000 1958,0
( ) , S F A 877,1 11 0,0000 779,5
( ) , , S F A F 21,7 6 0,0014 29,4
( ) , , , S F A F S A 20,2 5 0,0011 21,9
Tabla XVI. S = sexo, F = facultad, A = admitido
38
por lo que de acuerdo al criterio BIC se decidira por el modelo ( ) , , S F A F , modelo que por otra parte
es el ms fcil de interpretar.
9.6. Otras alternativas para analizar tablas de contingencia de ms de dos variables
En ocasiones cuando se estudia la asociacin entre variables cualitativas, una de ellas puede considerarse
como variable respuesta y las otras como variables o factores explicativos de la respuesta. Los modelos log-
lineales tratan todas las variables de forma simtrica, no distinguiendo entre variable respuesta y el resto de
variables, por ello en el caso de que claramente se identifique una variable como respuesta puede ser ms
natural utilizar modelos logsticos, los cuales describen esa dependencia. Su utilizacin es ms habitual
sobre todo si la variable respuesta es dicotmica (dos categoras), ya que el modelo logstico permite
cuantificar la asociacin mediante los odds ratio correspondientes, que se pueden estimar directamente del
modelo (aunque tambin puede ser estimados a partir del resultado del modelo log-lineal pero de forma un
poco ms compleja).
Para calcular el modelo logstico para los datos de admisin en la Universidad en el que la variable
admisin puede considerarse como variable respuesta y es adems dicotmica, hay que codificar
previamente la variable facultad como variable dummy.
En la siguiente tabla se indica el resultado obtenido al ajustar un modelo logstico en el que adems se ha
introducido un trmino de interaccin entre las variables sexo y facultad (equivalente al concepto de
asociacin en el modelo log-lineal).
trmino coeficiente error estndar
2
p
constante 0,4921 0,0717 47,044 0
SEXO 1,0521 0,2627 16,038 0,0000621
FACULTAD* 514,756 0,0000
FACULTAD 1 0,0416 0,1132
FACULTAD 2 -1,0276 0,1355
FACULTAD 3 -1,1961 0,1264
FACULTAD 4 -1,4491 0,1768
FACULTAD 5 -3,2619 0,2312
SEXO,FACULTAD* 20,204 0,0011
SEXO,FACULTAD 1 -0,8321 0,5104
SEXO,FACULTAD 2 -1,1770 0,2996
SEXO,FACULTAD 3 -0,9701 0,3026
SEXO,FACULTAD 4 -1,2523 0,3303
SEXO,FACULTAD 5 -0,8632 0,4027
Tabla XVII.
A partir de este modelo, que tiene en cuenta la facultad en la que se presenta la solicitud de admisin, el
odds ratio favorece a las mujeres frente a los hombres con un valor de 2,86 (intervalo de confianza 95 %: de
1,71 a 4,79), lo que contrasta con el valor de 0,54 (intervalo de confianza al 95 %: de 0,.48 a 0,62) obtenido
sin tener en cuenta la facultad, que favoreca a los hombres.
Cuando la variable considerada como respuesta es politmica (ms de dos categoras), como puede ser el
caso de la hipertensin en el primer ejemplo, donde la variable respuesta sera la clasificacin de nivel de
hipertensin, una posible alternativa a utilizar es el modelo logstico para variables politmicas, sin embargo
en estos casos a veces son ms sencillos de interpretacin los modelos log-lineales.
Cuando no hay claramente una variable respuesta o, por el contrario, son ms de una las variables que
pueden ser consideradas como respuesta, los modelos log-lineales son la alternativa adecuada para el
anlisis de tablas de contingencia multidimensionales.
En todo este artculo se han tratado las variables cualitativas como nominales, es decir que las respuestas
son meras clasificaciones con un nombre o una etiqueta, sin considerar que exista ninguna relacin de
orden entre las distintas respuestas. Esto es as en variables como sexo o facultad, en uno de los
39
ejemplos, pero sin embargo en el ejemplo de la hipertensin arterial s que existe una relacin ordinal en las
variables hipertension y nivel de estudios, clasificacin ordinal que puede ser tomada en cuenta a la hora
de elaborar el modelo, de tal forma que mejore el ajuste del mismo a los valores observados.
10. Bibliografa
www2.uca.es/serv/ai/formacin/spss/Pantalla/12contin.pdf
www2.chass.ncsu.edu/garson/pa765/assocnominal.htm
www2.chass.ncsu.edu/garson/pa765/assordinal.htm
www2.chass.ncsu.edu/garson/pa765/assoc2x2.htm
www.fisterra.com/mbe/investiga/index.asp
www.seh-lelha.org/stat1.htm
www.hrc.es/bioest/M_docente.html
www.cytel.com/Products/StatXact/techpapers.asp

También podría gustarte