Está en la página 1de 18

COEFICIENTES DE ASOCIACIN PARA VARIABLES ORDINALES

En comparacin con las variables nominales, las variables ordinales proporcionan informacin adicional: el orden o
jerarqua (clasificacin) de las categoras. Aunque podemos usar coeficientes (Q de Yule, Phi de Pearson, C de
Contingencia, V de Cramer, etc) que se han utilizado para cuantificar la asociacin entre variables nominales para
cuantificar la asociacin entre variables ordinales, las variables ordinales tienen todas las propiedades nominales y
otras propiedades adicionales.
Las relaciones entre dos variables ordinales poseen una caracterstica que no tienen las nominales, poseen direccin:
pueden ser positivas o negativas (signo del coeficiente). Dos variables estn correlacionadas positivamente si los
valores altos de una variable estn asociados con valores altos en el otro o los valores bajos en el primero estn
asociados con valores bajos en el segundo. Estn correlacionadas negativamente si la relacin se invierte.
Varios coeficientes de asociacin ordinales se basan en la comparacin de todos los posibles pares de observaciones,
teniendo en cuenta el grado de concordancia o correlacin entre dos variables cuyos datos estn medidos por lo
menos en un nivel ordinal, es decir, que puedan organizarse de menor a mayor.

PARES CONCORDANTES
Dos pares son concordantes si el orden (mayor o menor que) de los dos puntos en la primera variable es el mismo
que el orden de los dos puntos correspondientes de la segunda variable. Es decir que dos pares de observaciones
( , ) ; ( , ) son concordantes si los rangos de sus elementos coinciden, es decir si se cumple:

> , > o bien < , < .


PARES DISCORDANTES
Dos pares son discordantes si el orden (mayor o menor que) de los dos puntos en la primera variable , no es el
mismo que el orden de los dos puntos correspondientes de la segunda variable , (cuando una se incrementa, la
otra se reduce) Es decir que dos pares de observaciones ( , ) ; ( , ) son discordantes si se cumple:

> , < o bien < , > .


PARES COINCIDENTES

Cuando los dos casos tienen idnticos valores en una o ambas variables, es decir para dos pares de observaciones
( , ) ; ( , ) se cumple:

= o bien = .
Se pueden presentar tres casos:

PARES COINCIDENTES CON RESPECTO A VARIABLE X

Los valores de los casos pueden coincidir en X pero no en los valores de Y.

PARES COINCIDENTES CON RESPECTO A VARIABLE Y

Los valores de los casos pueden coincidir en Y pero no en los valores de X.

PARES COINCIDENTES TOTAL CON RESPECTO A LAS DOS VARIABLES

Los valores de los casos pueden coincidir en X y en Y.

Consideremos la distribucin conjunta, como se muestra en la siguiente tabla:


Variable X

Variable Y

1
2

1
2

Ejemplo:
Consideremos la distribucin conjunta, como se muestra en la siguiente tabla:

Variable X

Variable Y

Variable X

Variable Y

3
1
4
2
2
1

4
2
1
3
4
3

Variable X

Variable Y

3
1
4
2
2
1

4
2
1
3
4
3

3
1
4
2
2
1

4
2
1
3
4
3

PARES CONCORDANTES

PARES DISCORDANTES

( , ) ; ( , )

( , ) ; ( , )

PARES COINCIDENTES
( , ) ; ( , )

(1,2) ; (2,4)

(4,1) ; (1,3)

(1,2) ; (1,3)

(1,2) ; (2,3)

(4,1) ; (2,3)

(2,3) ; (2,4)

(2,3) ; (3,4)

(4,1) ; (3,4)

(2,3) ; (1,3)

Cuando se tiene una tabla de contingencia o doble entrada estamos considerando muchos datos, entonces el
clculo se hace ms complejo, por lo que recurrimos a un algoritmo para su clculo de los casos de pares
(concordantes, discordantes o coincidentes) que se conforman.
Ejemplo:
Consideremos la siguiente tabla de contingencia. Calculemos el nmero de pares concordantes, nmero de
pares discordantes y nmero de pares coincidentes.
X/Y
Baja
Media
Alta

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

CLCULO DEL NMERO DE PARES CONCORDANTES " "


Se obtienen multiplicando la frecuencia de cada casilla de la tabla, por la suma de las frecuencias que cada
casilla tiene a su derecha y abajo y sumando los productos.
X/Y
Baja
Media
Alta

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

X/Y
Baja
Media
Alta

2(1+3+2+1)=2(7)=28
X/Y
Baja
Media
Alta

Bajo
2
2
0

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

0(3+1)=0(4)=0

Medio Alto
0
1
1
3
2
1

X/Y
Baja
Media
Alta

2(2+1)=2(3)=6

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

1(1)=1

Entonces el nmero de pares concordantes

es:

= + + + =
CLCULO DEL NMERO DE PARES DISCORDANTES "

"

Del mismo modo que el caso anterior pero sumando las frecuencias que estn por debajo y a la izquierda
de cada casilla.
X/Y
Baja
Media
Alta

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

X/Y
Baja
Media
Alta

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

0(2+0)=0(2)=0

1(2+1+0+2)=1(5)=5
X/Y
Baja
Media
Alta

Bajo
2
2
0

X/Y
Baja
Media
Alta

Medio Alto
0
1
1
3
2
1

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

1(0)=0

3(0+2)=3(2)=6

Entonces el nmero de pares discordantes

es:

= + + + =
CLCULO DEL NMERO DE PARES COINCIDENTES CON RESPECTO A LA VARIABLE INDEPENDIENTE X
" "
Se obtienen multiplicando, por filas, cada frecuencia de las casillas de la fila por la suma de las frecuencias
de las casillas que estn a la derecha de la fila y sumando los productos dentro de cada fila, y las filas
entre s.
X/Y
Baja
Media
Alta

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

2(0+1)+0(1)=2

X/Y
Baja
Media
Alta

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

2(1+3)+1(3)=11

Entonces el nmero de pares coincidentes con respecto a X

" " es:

= + + =

X/Y
Baja
Media
Alta

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

0(2+1)+2(1)=2

CLCULO DEL NMERO DE PARES COINCIDENTES CON RESPECTO A LA VARIABLE DEPENDIENTE X


" "
Se obtienen multiplicando, por columnas, cada frecuencia de las casillas de la columna por la suma de las
frecuencias de las casillas inferiores de la columna y sumando los productos dentro de cada columna, y las
columnas entre s.
X/Y
Baja
Media
Alta

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

2(2+0)+2(0)=4

X/Y
Baja
Media
Alta

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

X/Y
Baja
Media
Alta

0(1+2)+1(2)=2

Entonces el nmero de pares coincidentes con respecto a Y

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

1(3+1)+3(1)=7

" " es:

= + + =

PRINCIPIOS
Si la mayora de los pares ( , ) ; ( , ) son CONCORDANTES, la asociacin de las variables X e Y es
positiva; la variable X crece (o decrece) en el sentido de la variable Y.

Si la mayora de los pares ( , ) ; ( , ) son DISCORDANTES, la asociacin de las variables X e Y es


negativa; si una variable tiende a crecer en un sentido, en el mismo sentido la otra decrece.

Si los pares CONCORDANTES y DISCORDANTES son aproximadamente iguales, se dice que no existe
asociacin.
Aqu est una lista de los coeficientes ms comunes basados en pares CONCORDANTES, DISCORDANTES o
COINCIDENTES:
1)
2)
3)
4)
5)
6)

Coeficiente Gamma de Goodman y Kruskal ().


Coeficiente d de Somers (d).
Coeficiente TauA de Kendall (TauA).
Coeficiente TauB de Kendall (TauB).
Coeficiente TauC de Kendall (TauC).
Una alternativa a esta familia de coeficientes es el coeficiente de correlacin de orden de Spearman
(correlacin de Spearman).

CARACTERSTICAS
Cuanto ms prximos estn los valores de estas medidas a 0 ms dbil ser la asociacin entre las variables.
Cuanto ms cercanos a 1 (o a 1) sean los valores de todas estas medidas mayores ser la asociacin positiva
(negativa) entre las variables.

COEFICIENTE DE ASOCIACIN

GAMMA DE GOODMAN Y KRUSKAL

Gamma es otra medida de asociacin, que se basa en el principio de


la reduccin proporcional del error (RPE) cuando se utiliza el valor de
la variable independiente para predecir el valor de la variable
dependiente.
Gamma calcula el nmero de pares en una tabulacin cruzada que
tiene el mismo orden de rango de desigualdad en ambas variables
(PARES CONCORDANTES) y lo compara con el nmero de pares que
tienen el orden inverso de la desigualdad en ambas variables (PARES
DISCORDANTES). Toma la diferencia entre concordancia y
discordancia y divide esto por el nmero total de pares concordantes
y discordantes y se expresa como:


,
+

Leo
Goodman
naci en Nueva
York en 1928

William Henry Kruskal


(10 de octubre de 1919 21 de abril de 2005) fue
un
matemtico
y
estadstico
estadounidense.

Donde:

: Nmero de pares concordantes (semejantes)


: Nmero de pares discordantes (No semejantes)
INTERPRETACIN

= : Significa que la informacin adicional proporcionada por la variable independiente no ayuda a la


prediccin

= : Significa que el uso de la variable independiente da como resultado ningn error de prediccin
PROPIEDADES

Gamma es una medida simtrica de asociacin y por lo que su valor es el mismo independientemente de qu
variable sea la variable dependiente.
La desventaja de este estadstico es que tiende a sobrestimar el grado de relacin, por lo que es ms comn
el uso de otros estadsticos para variables ordinales. Suele presentar valores mayores que las tau b y tau c.
Su clculo se realiza poniendo en relacin los casos concordantes con los casos discordantes. Este estadstico
no tiene en cuenta el nmero de casos empatados y tampoco hace correcciones segn el tamao de la tabla.
En caso de que dos o ms sujetos tengan los mismos rangos, entonces la estadstica gamma se prefiere a
Spearman o Kendall tau. Gamma se basa en suposicin similar a la utilizada por Spearman o Kendall tau, pensado
en trminos de interpretacin, es ms similar a Kendall tau que Spearman.
Es una medida similar a tau, pero es ms fuerte y ms frecuentemente utilizada.
Se puede interpretar como la reduccin del error cometido al predecir el ordenamiento de los casos de una
variable dependiente mediante el conocimiento de la ordenacin de una variable independiente.
Se utiliza para medir el grado de concordancia entre dos variables ordinales, cuando la muestra consta de
muchas observaciones y son muy pocos los valores ordinales alcanzados por ellas, ser muy grande el nmero
de empates, en este caso es recomendable utilizar este coeficiente.
Gamma tambin se puede utilizar con variables dicotmicas nominales. En este caso es equivalente al
coeficiente Q de Yule para tablas 2 x 2.

OBSERVACIONES
Para que la interpretacin del coeficiente Gamma resulte ms clara, conviene reordenar una tabla de forma que
ambas variables se orienten en el mismo sentido, en sentido creciente o decreciente:

Ejemplo
Sea el atributo bidimensional (X; Y), donde X: Edad de 3 trabajadores, cuyas modalidades son baja, mediana y
alta e Y: salario anual de los 3 trabajadores, cuyas modalidades son bajo, medio y alto. Supngase que la
distribucin de frecuencias absolutas es la que se presenta en la tabla de doble entrada siguiente:
X/Y
Baja
Media
Alta

Bajo
0
0
1

Medio Alto
0
1
1
0
0
0

Solucin
El nmero de concordancias es = 0, mientras que el nmero de discordancias es = 1. Por tanto, el coeficiente de
Gamma de Goodman y Kruskal es:

Interpretacin ___________________________________
_______________________________________________

Ejemplo
Supngase que la distribucin de frecuencias absolutas es la que se presenta en la siguiente tabla de considerando
12 trabajadores en el estudio:
X/Y
Baja
Media
Alta

Bajo
2
2
0

Medio Alto
0
1
1
3
2
1

Interpretacin ___________________________________
_______________________________________________

Los pares concordantes, se ordenan iguales en cada variable, se agrupan alrededor de la diagonal principal, e indican
una relacin positiva en la tabla.
Los pares discordantes, se ordenan ms arriba en una variable que el orden, agrupan alrededor de la diagonal y
sugieren una relacin inversa entre las variables.
En lugar de usar frmulas para encontrar, usamos un algoritmo, un conjunto de instrucciones que se aplica a tablas
de cualquier tamao.

Ejemplo
Sean las variables ordinales X: Satisfaccin laboral, cuyas modalidades son alta, media y baja y la variable Y:
Seguridad en el empleo, cuyas modalidades son alta, medio y baja. Analizar si hay relacin entre la el grado
de Satisfaccin laboral y el grado de Seguridad en el empleo. El cuadro de informaciones se presenta en la siguiente
tabla:
Satisfaccin Seguridad en el
laboral
empleo
Alta Media Baja
Alta
16
8
14
Media
19
17
60
Baja
9
11
56
Solucin
Como las variables sor ordinales, utilizamos el coeficiente Gamma . Para calcular necesitamos determinar el
nmero de pares concordantes y el nmero de pares discordantes .
Como tenemos una tabla de contingencia, usamos el siguiente algoritmo para el clculo:
PARES CONCORDANTES

Alta
Media
Baja

Alta Media Baja


16
8
14
19
17
60
9
11
56

Alta
Media
Baja

Alta Media Baja


16
8
14
19
17
60
9
11
56

Alta
Media
Baja

Alta
Media
Baja

Alta Media Baja


16
8
14
19
17
60
9
11
56
Alta Media Baja
16
8
14
19
17
60
9
11
56

( + + + ) =
( + ) =
( + ) =
() =
=
PARES DISCORDANTES

Alta
Media
Baja

Alta Media Baja


16
8
14
19
17
60
9
11
56

Alta
Media
Baja

Alta Media Baja


16
8
14
19
17
60
9
11
56

Alta
Media
Baja

Alta Media Baja


16
8
14
19
17
60
9
11
56

Alta
Media
Baja

Alta Media Baja


16
8
14
19
17
60
9
11
56

( + + + ) =
( + ) =
( + ) =
() =
=
=


=
= .
+ +

Interpretacin
El coeficiente Gamma = . nos indica que existe una asociacin moderada o leve entre la ordenacin de las
categoras de ambas variables. En trminos del error podemos decir que, conociendo el orden de la variable
Seguridad en el empleo, es posible reducir el error en el ordenamiento de la variable Satisfaccin laboral en un
39,6%.
En nuestro caso Gamma vale 0,396 lo que indica cierto grado de relacin positiva, es decir, conocer el orden de la
variable independiente puede ayudarnos a predecir el orden de la variable dependiente.

UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPA


ESCUELA PROFESIONAL DE RELACIONES INDUSTRIALES
CURSO: ESTADSTICA APLICADA A LAS RELACIONES INDUSTRIALES
PROF.: LIC. LUIS GUERRA JORDAN
NOVENA PRCTICA PARTE II
TEMA: COEFICIENTE GAMMA DE GOODMAN Y KRUSKALL

1.

En un estudio sobre poltica internacional, realizado en febrero de 2002, se pregunt a una muestra de 2.471 personas
acerca de la atencin que prestaban a las noticias, cuestiones o acontecimientos que suceden en otros pases. Las
respuestas a la pregunta aparecen resumidas en la tabla siguiente:
Nivel de estudios
Medio
99
664
382
66
1211

Bajo
52
368
332
138
890

Mucha
Bastante
Poca
Ninguna

Alto
86
233
40
11
370

a. Complete la tabla de contingencia por cantidad de personas (frecuencia simple porcentual) considerando la variable
independiente X (Nivel de estudios) y la variable dependiente Y (Nivel de atencin que prestan a las noticias,
cuestiones o acontecimientos que suceden en otros pases).
Nivel de estudios
Medio

Bajo

Alto

Mucha
Bastante
Poca
Ninguna
100%

100%

100%

b. Realizar las grficas de barras agrupadas por frecuencias absolutas (cantidad de personas) y por porcentajes
considerando al Status de los Padres como variable independiente de acuerdo a las tablas anteriores.

c. Calcule e interprete el coeficiente Gamma para esta muestra que mide la asociacin entre el nivel de estudios y el
grado de atencin prestada a las cuestiones internacionales.

2.

En una encuesta sobre movilidad social se han cruzado los datos del nivel de estudios de los encuestados con los de sus
padres, obtenindose la siguiente tabla:

Hijos
Superiores
Medios
Primarios
Total

Primarios
30
60
75
165

Padres
Medios
50
55
39
144

Superiores
69
49
31
149

Total
149
164
145
458

a. Complete la tabla de contingencia por cantidad de personas (frecuencia absoluta simple y porcentual) considerando
la variable independiente X (Nivel de estudios) y la variable dependiente Y (Nivel de atencin que prestan a las
noticias, cuestiones o acontecimientos que suceden en otros pases).

b. Realizar las grficas de barras agrupadas y apiladas (frecuencias absolutas) de acuerdo al Status de los Padres.

c. Calcule el coeficiente de asociacin Gamma y comente el resultado.

COEFICIENTE DE ASOCIACIN TAU DE KENDALL

El coeficiente Tau compara la diferencia


entre el nmero de pares concordantes y
discordantes con el mximo de los pares
que son posibles construir a partir del
nmero de unidades del anlisis en la
muestra. Las propiedades de este
coeficiente fueron estudiadas por el
estadstico ingls Sir Maurice Kendall en
un trabajo publicado en 1938. El
coeficiente de Kendall viene dado por:


,
+

Sir Maurice George Kendall, nacido 06


de septiembre 1907 en Kettering y
muri 29 de marzo 1983 es un
estadstico britnico.
Despus de estudiar matemticas en la
universidad de San Juan, Cambridge,
Kendall empez su carrera en el
Ministerio de Agricultura del Reino
Unido. De 1949 a 1961, se desempe
como Presidente de Estadsticas de la
London School of Economics.
En 1972, Kendall es el director de la Encuesta Mundial de
Fecundidad realizada por el Instituto Internacional de
Estadstica en colaboracin con la ONU. Miembro de la Real
Sociedad de Estadstica en 1943, fue presidente dos veces.
Maurice Kendall fue nombrado caballero en 1974.
Las principales publicaciones:

Maurice Kendall, "una nueva medida de correlacin de


rangos" Biometrika, vol. 30, No. 1-2, 1938, p. 81-89.

Mtodos de correlacin Rank, 1948.

Una introduccin a la teora de las estadsticas, en


1968.

Donde:

: Nmero de pares concordantes (semejantes)


: Nmero de pares discordantes (No semejantes)
: Tamao de la muestra.
INTERPRETACIN

= : Independencia
= +: Asociacin es mxima (coinciden las dos ordenaciones)
= : Asociacin es mxima (Cuando las dos ordenaciones son inversas)
Estos coeficientes son una alternativa al coeficiente inicial Tau de Kendall. En stos ya se tiene en cuenta
expresamente los empates (PARES COINCIDENTES).
El coeficiente Gamma puede inflar la relacin existente entre dos variables al no tener en cuenta el nmero
de casos empatados (PARES COINCIDENTES). La tau de kendall es otro estadstico cuyo clculo es similar
al de Gamma pero que adems incluye los casos empatados.

COEFICIENTE DE ASOCIACIN

TAU-b DE KENDALL

El coeficiente Tau-b compara la diferencia entre el nmero de pares concordantes y discordantes, pero
adems toma en cuenta el nmero de pares coincidentes con respecto a la variable independiente X y la
variable dependiente Y (empates con respecto a X y con respecto a Y). El coeficiente de Kendall viene dado
por:


+ + + +

CARACTERSTICAS

Toma valores entre -1 y 1, aunque no alcanza los valores extremos en tablas que no son cuadradas, es
decir, en tablas con diferente nmero de filas que de columnas.
En otro tipo de tablas es mejor recurrir a tau-c que puede obtener valores entre -1 y 1 cuando se
produce una relacin perfecta.
El coeficiente Tau b de Kendall , es adecuado para el anlisis de tablas de contingencia con muchos
casos en cada uno (y en esta situacin se prefiere sobre rho de Spearman).
Sin embargo, puede alcanzar su mayor valor de 1,0 o -1,0 slo para tablas de contingencia cuadradas
donde el nmero de filas es igual al nmero de columnas, por lo que su uso debe limitarse a este tipo
de problema.

Ejemplo
Sean las variables ordinales X: Satisfaccin de una pareja, cuyas modalidades son baja, media y alta y la
variable Y: satisfaccin en el empleo, cuyas modalidades son baja, media y alta. Analizar si hay relacin
entre la el grado de Satisfaccin de la pareja y la satisfaccin en el empleo. El cuadro de informaciones se
presenta en la siguiente tabla:

Satisfaccin
empleo

Vamos a ver su clculo para


un ejemplo concreto:

Baja
media
alta
Total

Satisfaccin de
pareja
baja media Alta
102 56
66
50
99
88
30
88
102
182 243 256

la
Total
224
237
220
681

102*50= 5.100
50*30= 1.500
102*30= 3.060
102*56= 5.544
etc... hasta completar la siguiente tabla

Los casos empatados para la "x" son 50

360, mientras que para la "y" son 48

Casos concordantes P= 68.692


Casos discordantes Q= 35.456


+ + + +

+ + + +

= ,
Interpretacin
La tau-b de Kendall es igual a 0,216, lo que indica cierto grado de relacin, aunque no muy alto.

878

COEFICIENTE DE ASOCIACIN

TAU-c DE KENDALL

El coeficiente Tau-c compara la diferencia entre el nmero de pares concordantes y discordantes, pero
adems toma en cuenta el nmero de pares coincidentes con respecto a la variable independiente X y la
variable dependiente Y (empates con respecto a X y con respecto a Y). El coeficiente de Kendall viene dado
por:


,
( )

Donde:
= {: }
: Nmero de filas
: Nmero de columnas

Los coeficientes Tau-b y Tau-c , proporcionarn valores ms bajos, ms conservadores


que los coeficientes de asociacin de Gamma de Goodman y Kruskal o D de Somers. Aunque
los valores de gamma sern siempre ms altos que Somer o el Tau-b y Tau-c tiene la
reduccin proporcional ms simple en la interpretacin del error.
El coeficiente Tau-c se debe utilizar para las tablas cruzadas rectangulares, donde hay muchos casos en cada
casilla y el nmero de filas no iguala el nmero de columnas. Este coeficiente compara la diferencia entre el
nmero de pares concordantes y el nmero de pares discordantes con una aproximacin del nmero total de
pares en la tabla cruzada utilizando el nmero de filas o el nmero de columnas, lo que sea menor.

Pollock (and we agree):


<.1 is weak; .1<<.2 is moderate; .2<<.3 moderately strong; .3< <1 strong.

CARACTERSTICAS

Toma valores entre -1 y 1, aunque no alcanza los valores extremos en tablas que no son cuadradas, es
decir, en tablas con diferente nmero de filas que de columnas.
En otro tipo de tablas es mejor recurrir a tau-c que puede obtener valores entre -1 y 1 cuando se
produce una relacin perfecta.
El coeficiente Tau b de Kendall , es adecuado para el anlisis de tablas de contingencia con muchos
casos en cada uno (y en esta situacin se prefiere sobre rho de Spearman).
Sin embargo, puede alcanzar su mayor valor de 1,0 o -1,0 slo para tablas de contingencia cuadradas
donde el nmero de filas es igual al nmero de columnas, por lo que su uso debe limitarse a este tipo
de problema.

Ejemplo
En un estudio, a los farmacuticos se les pidi si estn de acuerdo con una declaracin utilizando la escala de
Likert. Al mismo tiempo de acuerdo a los aos de prctica de farmacia en los encuestados, se dividieron en
cuatro categoras ordinales. Los resultados se enumeran en la Tabla 17.2. Cul es la fuerza de la asociacin
entre estas dos variables?

Como se trata de dos variables ordinales (la variable cuantitativa: aos de prctica ha sido transformada en
ordinal en cuatro categoras), y teniendo presente que el nmero de filas y columnas son diferentes entonces
podemos aplicar el coeficiente Tau-c de Kendall.

Primero calculamos el nmero de pares concordantes


( )

y discordantes :

= () + () + () + + () + () =
= () + () + () + + () + () =
Como esta tabla no es cuadrada, el coeficiente (estadstico) ms apropiado debe ser Tau-c de Kendall.

=
Donde:


( )

=
=
= Nmero de filas
=

Nmero de columnas

= (, ) =
= Tamao de la muestra
Reemplazando tenemos:

Interpretacin


( )
()

= ,

La tau-c de Kendall es igual a 0,060, lo que indica muy bajo el grado de relacin.

El coeficiente de correlacin tau de Kendall puede usarse como alternativa al coeficiente


de correlacin de Spearman para datos en forma de rangos.

UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPA


ESCUELA PROFESIONAL DE RELACIONES INDUSTRIALES
CURSO: ESTADSTICA APLICADA A LAS RELACIONES INDUSTRIALES
PROF.: LIC. LUIS GUERRA JORDAN
DCIMA PRCTICA PARTE II
TEMA: COEFICIENTES TAU DE KENDALL

La siguiente tabla presenta un ejemplo hipotticos de relacin entre las variables categricas de nivel ordinal;
Edad del estudiante graduado y nivel de motivacin (desmotivado, no muy motivado, algo motivado y altamente
motivado). En ambos ejemplos, los porcentajes difieren y, por lo tanto, las variables estn relacionadas. Cul
es la fuerza de la asociacin entre estas dos variables?

Nivel de motivacin
Desmotivado
No muy motivado
Algo motivado
Altamente motivado

Edad del estudiante graduado


25 aos o 26 34
35 aos y ms
menos
aos
Total
25
20
10
25
20
15
20
20
25
30
40
50

a. Complete la tabla de contingencia Nivel de motivacin (frecuencia simple porcentual) considerando la variable
independiente X (Edad del estudiante graduado) y la variable dependiente Y (Nivel de motivacin).

Nivel de motivacin

Edad del estudiante graduado


25 aos o 26 34
35 aos y ms
menos
aos
Total

Desmotivado
No muy motivado
Algo motivado
Altamente motivado
100%

100%

100%

b. Realizar las grficas de barras agrupadas por frecuencias absolutas (cantidad de personas) y por porcentajes
considerando a la Edad del estudiante como variable independiente de acuerdo a las tablas anteriores.

c. Calcule e interprete el coeficiente tau-c de Kendall para esta muestra.

COEFICIENTE DE

El coeficiente es una medida de asociacin ordinal. El coeficiente se


nombra despus de que Roberto H. Somers, que lo propuso en 1962. Se utiliza como medida asimtrica.

El coeficiente modifica el coeficiente Gamma porque considera como una variable


independiente afecta sobre la variable dependiente. Esto proporcion un criterio ms
estricto para la fuerza de la asociacin.
Cuando se cree que la variable Y (columna) depende de la variable X (fila), entonces la frmula es:


,
+ +

Donde:

: Nmero de pares concordantes (semejantes)


: Nmero de pares discordantes (No semejantes)
: Nmero de pares coincidentes (Empates con respecto a la variable dependiente Y)

Cuando se cree que la variable X (fila) depende de la variable Y (columna), entonces la frmula es:


,
+ +

Donde:

: Nmero de pares concordantes (semejantes)


: Nmero de pares discordantes (No semejantes)
: Nmero de pares coincidentes (Empates con respecto a la variable dependiente X)
Cuando no se considera ninguna de ellas como dependiente, entonces la frmula es:


,
+ +

Donde:

: Nmero de pares concordantes (semejantes)


: Nmero de pares discordantes (No semejantes)
: Nmero de pares coincidentes totales.
INTERPRETACIN

= : Concordancia perfecta
= : Discordancia perfecta
= : No existe asociacin

ser igual a 1,0 slo cuando todos los casos tengan valores que se encuentren a lo largo de
la diagonal de la tabla cruzada.

Ejemplo
Sean las variables ordinales X: Satisfaccin de una pareja, cuyas modalidades son baja, media y alta y la
variable Y: satisfaccin en el empleo, cuyas modalidades son baja, media y alta. Analizar si hay relacin
entre la el grado de Satisfaccin de la pareja y la satisfaccin en el empleo. El cuadro de informaciones se
presenta en la siguiente tabla:
Satisfaccin
Satisfaccin de la
empleo
pareja
baja media Alta Total
Baja
102 56
66
224
Media
50
99
88
237
Alta
30
88
102 220
Total
182 243 256 681

Vamos a ver su clculo para un ejemplo concreto:


102*50= 5.100
50*30= 1.500
102*30= 3.060
102*56= 5.544
etc... hasta completar la siguiente tabla

Los casos empatados para la "x" son 50360, mientras que para la "y"
Casos concordantes =
Casos discordantes =

Casos coincidentes con respecto a X =


Casos coincidentes con respecto a Y =
Casos coincidentes totales =
Considerando a X como la variable dependiente, entonces:


+ +

Donde:

=
=
=
Reemplazando tenemos:


+ +

= .

son 48878

Considerando a Y como la variable dependiente, entonces:


,
+ +

Donde:

=
=
=
Reemplazando tenemos:


+ +

= .
Calculando sin considera variable dependiente (simtrica), entonces:


+ +

Donde:

=
=
=
Reemplazando tenemos:


+ +
= .

Interpretacin

UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPA


ESCUELA PROFESIONAL DE RELACIONES INDUSTRIALES
CURSO: ESTADSTICA APLICADA A LAS RELACIONES INDUSTRIALES
PROF.: LIC. LUIS GUERRA JORDAN
TEMA: COEFICIENTE

ONCEAVA PRCTICA PARTE II

En un estudio, a los farmacuticos se les pidi si estn de acuerdo con una declaracin utilizando la escala de
Likert. Al mismo tiempo de acuerdo a los aos de prctica de farmacia en los encuestados, se dividieron en
cuatro categoras ordinales. Los resultados se enumeran en la Tabla 17.2. Cul es la fuerza de la asociacin
entre estas dos variables?

a. Complete la tabla de contingencia Nivel de motivacin (frecuencia simple porcentual) considerando la variable
independiente X (Edad del estudiante graduado) y la variable dependiente Y (Nivel de motivacin).

Nivel de motivacin

Edad del estudiante graduado


25 aos o 26 34
35 aos y ms
menos
aos
Total

Desmotivado
No muy motivado
Algo motivado
Altamente motivado
100%

100%

100%

b. Realizar las grficas de barras agrupadas por frecuencias absolutas (cantidad de personas) y por porcentajes
considerando a la Edad del estudiante como variable independiente de acuerdo a las tablas anteriores.

c. Calcule e interprete el coeficiente para esta muestra.

También podría gustarte