Está en la página 1de 32

Tema 4.

Medidas de
asociación

1.- LEO A. GOODMAN


2.- WILLIAM HENRY KRUSKAL
El estadístico Chi-cuadrado


SIRVE: Ver si dos variables están o no asociadas


NO SIRVE: no nos dice si es alta o baja la asociadas
Veamos coeficientes para medir la intensidad en tablas 2x2

B No B Total
A f11 f12 f1.
No A f21 f22 f2.
Total f.1 f.2 n

1) Coeficiente Phi de Pearson


2) Riesgo relativo
3) Razón de productos cruzados

TABLAS 2x2
B No B Total
A f11 f12 f1.
No A f21 f22 f2.
Total f.1 f.2 n 1) Coeficiente Phi de Pearson

Se define el coeficiente Phi, de la forma siguiente:

( f11 f 22  f12 f 21 ) 2
   exp
2
/n 
f1. f 2 . f .1 f .2

TABLAS 2x2
B No B Total
A f11 f12 f1.
No A f21 f22 f2.
Total f.1 f.2 n 1) Coeficiente Phi de Pearson

Toma valores en el intervalo: 1    1

Interpretación:

Valor 1: se obtiene cuando la dependencia es


directa y perfecta,

Valor -1: se obtiene cuando la dependencia es


inversa y perfecta,

Valor 0: se obtiene cuando hay independencia.


TABLAS 2x2
1) Coeficiente Phi de Pearson

EJEMPLO

Para realizar un estudio de observación de conductas de


interacción en niños en situación de juego se ha entrenado
a dos observadores en la utilización de un sistema de
registro de conductas. Los dos observadores codifican con
el mismo sistema de categorías, requiriéndose que lo
utilicen con un mismo criterio. Para evaluar el nivel de
acuerdo entre los observadores y constatar si el
entrenamiento recibido ha sido adecuado, se pide a ambos
observadores que clasifiquen las conductas observadas en
un vídeo de prueba. Los resultados fueron los siguientes:

TABLAS 2x2
1) Coeficiente Phi de Pearson

EJEMPLO

Observ Observador B Total


ador A
A B
A 100 10 110
B 20 60 80
Total 120 70 190

Frecuencias esperadas

A B
A (110x120)/190=69,474 (110x70)/190=40,53
B (80x120)/190=50,526 (80x70)/190=29,47

TABLAS 2x2
1) Coeficiente Phi de Pearson

EJEMPLO

( fij  eij ) 2 (100  69,47) 2 (20  50,53) 2 (10  40,53) 2 (60  29,47) 2
 exp
2
       86,47
i j eij 69,474 50,526 40,53 29,47

Calculamos el coeficiente Phi de Pearson:

   exp
2
/ n  86,47 / 190  0,675

TABLAS 2x2
1) Coeficiente Phi de Pearson

EJEMPLO

Interpretación

Signo positivo  Dependencia directa

Vemos que el valor es moderado-alto

La mayoría de los que tienen un resultado A por el


observador A, también obtienen un resultado A por el
observador B

TABLAS 2x2
B No B Total
A f11 f12 f1.
No A f21 f22 f2.
Total f.1 f.2 n 2) Riesgo relativo

Se define el riesgo relativo por columnas, de la


forma siguiente:
P( A / B) f11 / f .1 f11 f .2
RR columnas   
P( A / B ) f12 / f .2 f .1 f12

Se define el riesgo relativo por filas, de la forma


siguiente:
P( B / A) f11 / f1. f11 f 2.
RR filas   
P( B / A ) f 21 / f 2. f 21 f1.

TABLAS 2x2
B No B Total
A f11 f12 f1.
No A f21 f22 f2.
Total f.1 f.2 n 2) Riesgo relativo

Toma valores en el intervalo: 0  RR  


Interpretación:

El RR = 1, informa que no hay asociación entre las variables.

El RR > 1, nos dice que existe asociación positiva.

El 0 < RR < 1, indica que existe una asociación negativa.

TABLAS 2x2
2) Riesgo relativo

EJEMPLO (Continuación)

Observ Observador B Total


ador A
A B
A 100 10 110
B 20 60 80
Total 120 70 190

Calculamos el riesgo relativo por columnas:


P(ObA _ A / ObB _ A) 100 / 120 100 x70
RRcolumnas     5,8333
P(ObA _ A / ObB _ B) 10 / 70 10 x120
Calculamos el riesgo relativo por filas:
P(ObB _ A / ObA _ A) 100 / 110 100 x80
RR filas     3,6364
P(ObB _ A / ObA _ B) 20 / 80 20 x110

TABLAS 2x2
2) Riesgo relativo

EJEMPLO (Continuación)

Interpretación
El RR > 1, nos dice que existe asociación positiva


Es 5,8333 veces más fácil tener un valor A por el observador
A cuando se tiene un valor A por el observador B que si se
tiene un valor B por el observador B.

Es 3,6364 veces más fácil tener un valor A por el observador


B cuando se tiene un valor A por el observador A que si se
tiene un valor B por el observador A.

TABLAS 2x2
B No B Total
A f11 f12 f1.
No A f21 f22 f2. 3) Razón de productos cruzados
Total f.1 f.2 n

Se define la razón de productos cruzados, de la


forma siguiente:

f11 f 22 f11 / f 21
RC  
f12 f 21 f12 / f 22
Toma valores en el intervalo: 0  RC  

TABLAS 2x2
B No B Total
A f11 f12 f1.
No A f21 f22 f2. 3) Razón de productos cruzados
Total f.1 f.2 n

Interpretación:

La RC = 1, hay la misma razón de casos que aparece A y no


A, cuando está B, que cuando no está presente B.

La RC < 1, la razón entre los casos que aparecen A y no A es


menor cuando está presente B.

La RC > 1, la razón entre los casos que aparecen A y no A es


mayor cuando está presente B.

TABLAS 2x2
3) Razón de productos cruzados

EJEMPLO (Continuación)

Observ Observador B Total


ador A
A B
A 100 10 110
B 20 60 80
Total 120 70 190

Calculamos la razón de productos cruzados:

f11 f 22 100 x60 6000


RC     30
f12 f 21 10 x20 200

TABLAS 2x2
3) Razón de productos cruzados

EJEMPLO (Continuación)

Interpretación

RC>1, la razón entre los resultados A y B del observador


A es superior cuando el sujeto tiene un valor A por el
observador B que cuando tiene un valor B.


Es decir, hay una dependencia directa

TABLAS 2x2
Veamos coeficientes para medir la intensidad en tablas rxc

Tablas con mayor número de columnas y/ó filas.

1) Coeficiente de contingencia de Pearson


2) V de Cramer
3) Lambda de Goodman y Kruskal

TABLAS rxc
1) Coeficiente de contingencia de Pearson

Se define el coeficiente de contingencia de Pearson, de la


forma siguiente:

C  2
exp /(  2
exp  n)
El valor máximo es:

Min{r  1, c  1}
MaxC 
1  Min{r  1, c  1}

TABLAS rxc
1) Coeficiente de contingencia de Pearson

Min{r  1, c  1}
Toma valores en el intervalo: 0C 
1  Min{r  1, c  1}
Interpretación:

C=0, indica independencia absoluta

C=Max(C), indica dependencia perfecta

TABLAS rxc
1) Coeficiente de contingencia de Pearson

EJEMPLO

Para analizar si el estado civil no era una variable


relevante a la hora de explicar las actitudes abortistas,
se ha encuestado a 500 sujetos obteniendo los
resultados que aparecen en la tabla siguiente.

Actitud Actitud Total


Abortista Antiabortista
Solteros 120 30 150
Casados 50 200 250
Divorciados 30 70 100
Total 200 300 500
TABLAS rxc
1) Coeficiente de contingencia de Pearson
EJEMPLO

Calculamos las frecuencias esperadas

Calculamos el valor Chi-cuadrado:


( f ij  eij ) 2

 2
exp    145,83
i j eij
Calculamos el valor C:
C  2
exp /(  2
exp  n)  0,475
Calculamos el valor máximo de C:
Min{r  1, c  1}
MaxC   0,7071
1  Min{r  1, c  1}
TABLAS rxc
2) V de Cramer

Se define el valor V de Cramer, de la forma siguiente:

V   exp
2
/ n( p  1)

El valor p es:

p = Min {número de filas, número de columnas}

TABLAS rxc
2) V de Cramer

Toma valores en el intervalo: 0 V  1

Interpretación:

V=0, indica independencia absoluta

V=1, indica dependencia perfecta

TABLAS rxc
2) V de Cramer

EJEMPLO (Continuación)

Actitud Actitud Total


Abortista Antiabortista
Solteros 120 30 150
Casados 50 200 250
Divorciados 30 70 100
Total 200 300 500

Calculamos el valor V de Cramer:

V   exp
2
/ n( p  1)  145,83 / 500 x(2  1)  0,54

TABLAS rxc
2) V de Cramer

EJEMPLO (Continuación)

Interpretación


V   exp
2
/ n( p  1)  145,83 / 500 x(2  1)  0,54


Es decir, hay una dependencia directa no muy alta

TABLAS rxc
3) Lambda de Goodman y Kruskal

Se define el valor Lambda, de la forma siguiente:

  f mj  f max
n  f max
Toma valores en el intervalo: 0   1

¡¡¡ LOCURA MATEMÁTICA!!!

TABLAS rxc
3) Lambda de Goodman y Kruskal

EJEMPLO (Continuación)

Actitud Actitud Total


Abortista Antiabortista
Solteros 120 30 150
Casados 50 200 250
Divorciados 30 70 100
Total n


120

200

250
máximo

  f mj  f max

(120  200)  250
 0,28
n  f max 500  250
TABLAS rxc
3) Lambda de Goodman y Kruskal

EJEMPLO (Continuación)

Interpretación


  f mj  f max

(120  200)  250
 0,28
n  f max 500  250


Es el 28% de error que se ve reducido al predecir el valor
de la variable dependiente X, conocido el valor de la
variable independiente Y

TABLAS rxc
RESUMEN

- Medidas para tablas 2x2


- Coeficiente Phi de Pearson

 1     exp
2
/ n 1

- Riesgo Relativo
- por filas f11 f 2.
0  RR filas  
f 21 f1.
- por columnas
f11 f.2
0  RRcolumnas  
f.1 f12
- Razón de productos cruzados
f11 f 22
0  RC  
f12 f 21
RESUMEN

-Medidas para tablas rxc


- Coeficiente de contingencia de Pearson
Minr  1, c  1
0C   2
/(  2
 n) 
1  Minr  1, c  1
exp exp

- V de Cramer

0  V   exp
2
/ n( Min (r , c)  1)  1

- Lambda de Goodman y Kruskal

0 
 f mj  f max
1
n  f max
GRACIAS POR
LA ATENCIÓN

También podría gustarte