Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En comparacin con las variables nominales, las variables ordinales proporcionan informacin adicional: el orden o
jerarqua (clasificacin) de las categoras. Aunque podemos usar coeficientes (Q de Yule, Phi de Pearson, C de
Contingencia, V de Cramer, etc) que se han utilizado para cuantificar la asociacin entre variables nominales para
cuantificar la asociacin entre variables ordinales, las variables ordinales tienen todas las propiedades nominales y
otras propiedades adicionales.
Las relaciones entre dos variables ordinales poseen una caracterstica que no tienen las nominales, poseen direccin:
pueden ser positivas o negativas (signo del coeficiente). Dos variables estn correlacionadas positivamente si los
valores altos de una variable estn asociados con valores altos en el otro o los valores bajos en el primero estn
asociados con valores bajos en el segundo. Estn correlacionadas negativamente si la relacin se invierte.
Varios coeficientes de asociacin ordinales se basan en la comparacin de todos los posibles pares de observaciones,
teniendo en cuenta el grado de concordancia o correlacin entre dos variables cuyos datos estn medidos por lo
menos en un nivel ordinal, es decir, que puedan organizarse de menor a mayor.
PARES CONCORDANTES
Dos pares son concordantes si el orden (mayor o menor que) de los dos puntos en la primera variable es el mismo
que el orden de los dos puntos correspondientes de la segunda variable. Es decir que dos pares de observaciones
( , ) ; ( , ) son concordantes si los rangos de sus elementos coinciden, es decir si se cumple:
Cuando los dos casos tienen idnticos valores en una o ambas variables, es decir para dos pares de observaciones
( , ) ; ( , ) se cumple:
= o bien = .
Se pueden presentar tres casos:
Variable Y
1
2
1
2
Ejemplo:
Consideremos la distribucin conjunta, como se muestra en la siguiente tabla:
Variable X
Variable Y
Variable X
Variable Y
3
1
4
2
2
1
4
2
1
3
4
3
Variable X
Variable Y
3
1
4
2
2
1
4
2
1
3
4
3
3
1
4
2
2
1
4
2
1
3
4
3
PARES CONCORDANTES
PARES DISCORDANTES
( , ) ; ( , )
( , ) ; ( , )
PARES COINCIDENTES
( , ) ; ( , )
(1,2) ; (2,4)
(4,1) ; (1,3)
(1,2) ; (1,3)
(1,2) ; (2,3)
(4,1) ; (2,3)
(2,3) ; (2,4)
(2,3) ; (3,4)
(4,1) ; (3,4)
(2,3) ; (1,3)
Cuando se tiene una tabla de contingencia o doble entrada estamos considerando muchos datos, entonces el
clculo se hace ms complejo, por lo que recurrimos a un algoritmo para su clculo de los casos de pares
(concordantes, discordantes o coincidentes) que se conforman.
Ejemplo:
Consideremos la siguiente tabla de contingencia. Calculemos el nmero de pares concordantes, nmero de
pares discordantes y nmero de pares coincidentes.
X/Y
Baja
Media
Alta
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
X/Y
Baja
Media
Alta
2(1+3+2+1)=2(7)=28
X/Y
Baja
Media
Alta
Bajo
2
2
0
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
0(3+1)=0(4)=0
Medio Alto
0
1
1
3
2
1
X/Y
Baja
Media
Alta
2(2+1)=2(3)=6
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
1(1)=1
es:
= + + + =
CLCULO DEL NMERO DE PARES DISCORDANTES "
"
Del mismo modo que el caso anterior pero sumando las frecuencias que estn por debajo y a la izquierda
de cada casilla.
X/Y
Baja
Media
Alta
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
X/Y
Baja
Media
Alta
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
0(2+0)=0(2)=0
1(2+1+0+2)=1(5)=5
X/Y
Baja
Media
Alta
Bajo
2
2
0
X/Y
Baja
Media
Alta
Medio Alto
0
1
1
3
2
1
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
1(0)=0
3(0+2)=3(2)=6
es:
= + + + =
CLCULO DEL NMERO DE PARES COINCIDENTES CON RESPECTO A LA VARIABLE INDEPENDIENTE X
" "
Se obtienen multiplicando, por filas, cada frecuencia de las casillas de la fila por la suma de las frecuencias
de las casillas que estn a la derecha de la fila y sumando los productos dentro de cada fila, y las filas
entre s.
X/Y
Baja
Media
Alta
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
2(0+1)+0(1)=2
X/Y
Baja
Media
Alta
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
2(1+3)+1(3)=11
= + + =
X/Y
Baja
Media
Alta
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
0(2+1)+2(1)=2
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
2(2+0)+2(0)=4
X/Y
Baja
Media
Alta
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
X/Y
Baja
Media
Alta
0(1+2)+1(2)=2
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
1(3+1)+3(1)=7
= + + =
PRINCIPIOS
Si la mayora de los pares ( , ) ; ( , ) son CONCORDANTES, la asociacin de las variables X e Y es
positiva; la variable X crece (o decrece) en el sentido de la variable Y.
Si los pares CONCORDANTES y DISCORDANTES son aproximadamente iguales, se dice que no existe
asociacin.
Aqu est una lista de los coeficientes ms comunes basados en pares CONCORDANTES, DISCORDANTES o
COINCIDENTES:
1)
2)
3)
4)
5)
6)
CARACTERSTICAS
Cuanto ms prximos estn los valores de estas medidas a 0 ms dbil ser la asociacin entre las variables.
Cuanto ms cercanos a 1 (o a 1) sean los valores de todas estas medidas mayores ser la asociacin positiva
(negativa) entre las variables.
COEFICIENTE DE ASOCIACIN
,
+
Leo
Goodman
naci en Nueva
York en 1928
Donde:
= : Significa que el uso de la variable independiente da como resultado ningn error de prediccin
PROPIEDADES
Gamma es una medida simtrica de asociacin y por lo que su valor es el mismo independientemente de qu
variable sea la variable dependiente.
La desventaja de este estadstico es que tiende a sobrestimar el grado de relacin, por lo que es ms comn
el uso de otros estadsticos para variables ordinales. Suele presentar valores mayores que las tau b y tau c.
Su clculo se realiza poniendo en relacin los casos concordantes con los casos discordantes. Este estadstico
no tiene en cuenta el nmero de casos empatados y tampoco hace correcciones segn el tamao de la tabla.
En caso de que dos o ms sujetos tengan los mismos rangos, entonces la estadstica gamma se prefiere a
Spearman o Kendall tau. Gamma se basa en suposicin similar a la utilizada por Spearman o Kendall tau, pensado
en trminos de interpretacin, es ms similar a Kendall tau que Spearman.
Es una medida similar a tau, pero es ms fuerte y ms frecuentemente utilizada.
Se puede interpretar como la reduccin del error cometido al predecir el ordenamiento de los casos de una
variable dependiente mediante el conocimiento de la ordenacin de una variable independiente.
Se utiliza para medir el grado de concordancia entre dos variables ordinales, cuando la muestra consta de
muchas observaciones y son muy pocos los valores ordinales alcanzados por ellas, ser muy grande el nmero
de empates, en este caso es recomendable utilizar este coeficiente.
Gamma tambin se puede utilizar con variables dicotmicas nominales. En este caso es equivalente al
coeficiente Q de Yule para tablas 2 x 2.
OBSERVACIONES
Para que la interpretacin del coeficiente Gamma resulte ms clara, conviene reordenar una tabla de forma que
ambas variables se orienten en el mismo sentido, en sentido creciente o decreciente:
Ejemplo
Sea el atributo bidimensional (X; Y), donde X: Edad de 3 trabajadores, cuyas modalidades son baja, mediana y
alta e Y: salario anual de los 3 trabajadores, cuyas modalidades son bajo, medio y alto. Supngase que la
distribucin de frecuencias absolutas es la que se presenta en la tabla de doble entrada siguiente:
X/Y
Baja
Media
Alta
Bajo
0
0
1
Medio Alto
0
1
1
0
0
0
Solucin
El nmero de concordancias es = 0, mientras que el nmero de discordancias es = 1. Por tanto, el coeficiente de
Gamma de Goodman y Kruskal es:
Interpretacin ___________________________________
_______________________________________________
Ejemplo
Supngase que la distribucin de frecuencias absolutas es la que se presenta en la siguiente tabla de considerando
12 trabajadores en el estudio:
X/Y
Baja
Media
Alta
Bajo
2
2
0
Medio Alto
0
1
1
3
2
1
Interpretacin ___________________________________
_______________________________________________
Los pares concordantes, se ordenan iguales en cada variable, se agrupan alrededor de la diagonal principal, e indican
una relacin positiva en la tabla.
Los pares discordantes, se ordenan ms arriba en una variable que el orden, agrupan alrededor de la diagonal y
sugieren una relacin inversa entre las variables.
En lugar de usar frmulas para encontrar, usamos un algoritmo, un conjunto de instrucciones que se aplica a tablas
de cualquier tamao.
Ejemplo
Sean las variables ordinales X: Satisfaccin laboral, cuyas modalidades son alta, media y baja y la variable Y:
Seguridad en el empleo, cuyas modalidades son alta, medio y baja. Analizar si hay relacin entre la el grado
de Satisfaccin laboral y el grado de Seguridad en el empleo. El cuadro de informaciones se presenta en la siguiente
tabla:
Satisfaccin Seguridad en el
laboral
empleo
Alta Media Baja
Alta
16
8
14
Media
19
17
60
Baja
9
11
56
Solucin
Como las variables sor ordinales, utilizamos el coeficiente Gamma . Para calcular necesitamos determinar el
nmero de pares concordantes y el nmero de pares discordantes .
Como tenemos una tabla de contingencia, usamos el siguiente algoritmo para el clculo:
PARES CONCORDANTES
Alta
Media
Baja
Alta
Media
Baja
Alta
Media
Baja
Alta
Media
Baja
( + + + ) =
( + ) =
( + ) =
() =
=
PARES DISCORDANTES
Alta
Media
Baja
Alta
Media
Baja
Alta
Media
Baja
Alta
Media
Baja
( + + + ) =
( + ) =
( + ) =
() =
=
=
=
= .
+ +
Interpretacin
El coeficiente Gamma = . nos indica que existe una asociacin moderada o leve entre la ordenacin de las
categoras de ambas variables. En trminos del error podemos decir que, conociendo el orden de la variable
Seguridad en el empleo, es posible reducir el error en el ordenamiento de la variable Satisfaccin laboral en un
39,6%.
En nuestro caso Gamma vale 0,396 lo que indica cierto grado de relacin positiva, es decir, conocer el orden de la
variable independiente puede ayudarnos a predecir el orden de la variable dependiente.
1.
En un estudio sobre poltica internacional, realizado en febrero de 2002, se pregunt a una muestra de 2.471 personas
acerca de la atencin que prestaban a las noticias, cuestiones o acontecimientos que suceden en otros pases. Las
respuestas a la pregunta aparecen resumidas en la tabla siguiente:
Nivel de estudios
Medio
99
664
382
66
1211
Bajo
52
368
332
138
890
Mucha
Bastante
Poca
Ninguna
Alto
86
233
40
11
370
a. Complete la tabla de contingencia por cantidad de personas (frecuencia simple porcentual) considerando la variable
independiente X (Nivel de estudios) y la variable dependiente Y (Nivel de atencin que prestan a las noticias,
cuestiones o acontecimientos que suceden en otros pases).
Nivel de estudios
Medio
Bajo
Alto
Mucha
Bastante
Poca
Ninguna
100%
100%
100%
b. Realizar las grficas de barras agrupadas por frecuencias absolutas (cantidad de personas) y por porcentajes
considerando al Status de los Padres como variable independiente de acuerdo a las tablas anteriores.
c. Calcule e interprete el coeficiente Gamma para esta muestra que mide la asociacin entre el nivel de estudios y el
grado de atencin prestada a las cuestiones internacionales.
2.
En una encuesta sobre movilidad social se han cruzado los datos del nivel de estudios de los encuestados con los de sus
padres, obtenindose la siguiente tabla:
Hijos
Superiores
Medios
Primarios
Total
Primarios
30
60
75
165
Padres
Medios
50
55
39
144
Superiores
69
49
31
149
Total
149
164
145
458
a. Complete la tabla de contingencia por cantidad de personas (frecuencia absoluta simple y porcentual) considerando
la variable independiente X (Nivel de estudios) y la variable dependiente Y (Nivel de atencin que prestan a las
noticias, cuestiones o acontecimientos que suceden en otros pases).
b. Realizar las grficas de barras agrupadas y apiladas (frecuencias absolutas) de acuerdo al Status de los Padres.
,
+
Donde:
= : Independencia
= +: Asociacin es mxima (coinciden las dos ordenaciones)
= : Asociacin es mxima (Cuando las dos ordenaciones son inversas)
Estos coeficientes son una alternativa al coeficiente inicial Tau de Kendall. En stos ya se tiene en cuenta
expresamente los empates (PARES COINCIDENTES).
El coeficiente Gamma puede inflar la relacin existente entre dos variables al no tener en cuenta el nmero
de casos empatados (PARES COINCIDENTES). La tau de kendall es otro estadstico cuyo clculo es similar
al de Gamma pero que adems incluye los casos empatados.
COEFICIENTE DE ASOCIACIN
TAU-b DE KENDALL
El coeficiente Tau-b compara la diferencia entre el nmero de pares concordantes y discordantes, pero
adems toma en cuenta el nmero de pares coincidentes con respecto a la variable independiente X y la
variable dependiente Y (empates con respecto a X y con respecto a Y). El coeficiente de Kendall viene dado
por:
+ + + +
CARACTERSTICAS
Toma valores entre -1 y 1, aunque no alcanza los valores extremos en tablas que no son cuadradas, es
decir, en tablas con diferente nmero de filas que de columnas.
En otro tipo de tablas es mejor recurrir a tau-c que puede obtener valores entre -1 y 1 cuando se
produce una relacin perfecta.
El coeficiente Tau b de Kendall , es adecuado para el anlisis de tablas de contingencia con muchos
casos en cada uno (y en esta situacin se prefiere sobre rho de Spearman).
Sin embargo, puede alcanzar su mayor valor de 1,0 o -1,0 slo para tablas de contingencia cuadradas
donde el nmero de filas es igual al nmero de columnas, por lo que su uso debe limitarse a este tipo
de problema.
Ejemplo
Sean las variables ordinales X: Satisfaccin de una pareja, cuyas modalidades son baja, media y alta y la
variable Y: satisfaccin en el empleo, cuyas modalidades son baja, media y alta. Analizar si hay relacin
entre la el grado de Satisfaccin de la pareja y la satisfaccin en el empleo. El cuadro de informaciones se
presenta en la siguiente tabla:
Satisfaccin
empleo
Baja
media
alta
Total
Satisfaccin de
pareja
baja media Alta
102 56
66
50
99
88
30
88
102
182 243 256
la
Total
224
237
220
681
102*50= 5.100
50*30= 1.500
102*30= 3.060
102*56= 5.544
etc... hasta completar la siguiente tabla
+ + + +
+ + + +
= ,
Interpretacin
La tau-b de Kendall es igual a 0,216, lo que indica cierto grado de relacin, aunque no muy alto.
878
COEFICIENTE DE ASOCIACIN
TAU-c DE KENDALL
El coeficiente Tau-c compara la diferencia entre el nmero de pares concordantes y discordantes, pero
adems toma en cuenta el nmero de pares coincidentes con respecto a la variable independiente X y la
variable dependiente Y (empates con respecto a X y con respecto a Y). El coeficiente de Kendall viene dado
por:
,
( )
Donde:
= {: }
: Nmero de filas
: Nmero de columnas
CARACTERSTICAS
Toma valores entre -1 y 1, aunque no alcanza los valores extremos en tablas que no son cuadradas, es
decir, en tablas con diferente nmero de filas que de columnas.
En otro tipo de tablas es mejor recurrir a tau-c que puede obtener valores entre -1 y 1 cuando se
produce una relacin perfecta.
El coeficiente Tau b de Kendall , es adecuado para el anlisis de tablas de contingencia con muchos
casos en cada uno (y en esta situacin se prefiere sobre rho de Spearman).
Sin embargo, puede alcanzar su mayor valor de 1,0 o -1,0 slo para tablas de contingencia cuadradas
donde el nmero de filas es igual al nmero de columnas, por lo que su uso debe limitarse a este tipo
de problema.
Ejemplo
En un estudio, a los farmacuticos se les pidi si estn de acuerdo con una declaracin utilizando la escala de
Likert. Al mismo tiempo de acuerdo a los aos de prctica de farmacia en los encuestados, se dividieron en
cuatro categoras ordinales. Los resultados se enumeran en la Tabla 17.2. Cul es la fuerza de la asociacin
entre estas dos variables?
Como se trata de dos variables ordinales (la variable cuantitativa: aos de prctica ha sido transformada en
ordinal en cuatro categoras), y teniendo presente que el nmero de filas y columnas son diferentes entonces
podemos aplicar el coeficiente Tau-c de Kendall.
( )
y discordantes :
= () + () + () + + () + () =
= () + () + () + + () + () =
Como esta tabla no es cuadrada, el coeficiente (estadstico) ms apropiado debe ser Tau-c de Kendall.
=
Donde:
( )
=
=
= Nmero de filas
=
Nmero de columnas
= (, ) =
= Tamao de la muestra
Reemplazando tenemos:
Interpretacin
( )
()
= ,
La tau-c de Kendall es igual a 0,060, lo que indica muy bajo el grado de relacin.
La siguiente tabla presenta un ejemplo hipotticos de relacin entre las variables categricas de nivel ordinal;
Edad del estudiante graduado y nivel de motivacin (desmotivado, no muy motivado, algo motivado y altamente
motivado). En ambos ejemplos, los porcentajes difieren y, por lo tanto, las variables estn relacionadas. Cul
es la fuerza de la asociacin entre estas dos variables?
Nivel de motivacin
Desmotivado
No muy motivado
Algo motivado
Altamente motivado
a. Complete la tabla de contingencia Nivel de motivacin (frecuencia simple porcentual) considerando la variable
independiente X (Edad del estudiante graduado) y la variable dependiente Y (Nivel de motivacin).
Nivel de motivacin
Desmotivado
No muy motivado
Algo motivado
Altamente motivado
100%
100%
100%
b. Realizar las grficas de barras agrupadas por frecuencias absolutas (cantidad de personas) y por porcentajes
considerando a la Edad del estudiante como variable independiente de acuerdo a las tablas anteriores.
COEFICIENTE DE
,
+ +
Donde:
Cuando se cree que la variable X (fila) depende de la variable Y (columna), entonces la frmula es:
,
+ +
Donde:
,
+ +
Donde:
= : Concordancia perfecta
= : Discordancia perfecta
= : No existe asociacin
ser igual a 1,0 slo cuando todos los casos tengan valores que se encuentren a lo largo de
la diagonal de la tabla cruzada.
Ejemplo
Sean las variables ordinales X: Satisfaccin de una pareja, cuyas modalidades son baja, media y alta y la
variable Y: satisfaccin en el empleo, cuyas modalidades son baja, media y alta. Analizar si hay relacin
entre la el grado de Satisfaccin de la pareja y la satisfaccin en el empleo. El cuadro de informaciones se
presenta en la siguiente tabla:
Satisfaccin
Satisfaccin de la
empleo
pareja
baja media Alta Total
Baja
102 56
66
224
Media
50
99
88
237
Alta
30
88
102 220
Total
182 243 256 681
Los casos empatados para la "x" son 50360, mientras que para la "y"
Casos concordantes =
Casos discordantes =
+ +
Donde:
=
=
=
Reemplazando tenemos:
+ +
= .
son 48878
,
+ +
Donde:
=
=
=
Reemplazando tenemos:
+ +
= .
Calculando sin considera variable dependiente (simtrica), entonces:
+ +
Donde:
=
=
=
Reemplazando tenemos:
+ +
= .
Interpretacin
En un estudio, a los farmacuticos se les pidi si estn de acuerdo con una declaracin utilizando la escala de
Likert. Al mismo tiempo de acuerdo a los aos de prctica de farmacia en los encuestados, se dividieron en
cuatro categoras ordinales. Los resultados se enumeran en la Tabla 17.2. Cul es la fuerza de la asociacin
entre estas dos variables?
a. Complete la tabla de contingencia Nivel de motivacin (frecuencia simple porcentual) considerando la variable
independiente X (Edad del estudiante graduado) y la variable dependiente Y (Nivel de motivacin).
Nivel de motivacin
Desmotivado
No muy motivado
Algo motivado
Altamente motivado
100%
100%
100%
b. Realizar las grficas de barras agrupadas por frecuencias absolutas (cantidad de personas) y por porcentajes
considerando a la Edad del estudiante como variable independiente de acuerdo a las tablas anteriores.