Está en la página 1de 15

Tabla de Correlacin o

Contingencia (atributos)

(al final del captulo)

Tabla de Correlacin o Contingencia


Permite ayudarnos a determinar si existe relacin de interdependencia
entre 2 variables, es decir, si se influyen mutuamente.

donde nij es el nmero de


observaciones que presentan
simultneamente las
caractersticas i, j de las variables A
y B, respectivamente.

As, una tabla de contingencia es una una tabla de doble


entrada, donde en cada casilla figurar el nmero de casos
o individuos que poseen un nivel de una de las
caractersticas analizadas y otro nivel de la otra
caracterstica.

Al analizar una distribucin bidimensional, uno puede centrar su


estudio en el comportamiento de una de las variables, con
independencia de como se comporta la otra. Estaramos as en el
anlisis de una distribucin marginal.

Distribucin marginal de A

Distribucin marginal de B

Ai

ni.

Bj

n.j

A1

n1.

B1

n.1

A2

n2.

B2

n.2

An-1

nn-1.

Bm-1

n.m-1

An

nn.

Bm

n.m

Distribuciones marginales
k

ni ni1 ni 2 ni 3 ... nij ... nik nij


j 1

n j n1 j n2 j n3 j ... nij ... nhj nij


i 1

Definimos:
J

ni nij
j 1

n j nij
i 1

n
i 1

nij
fi
j 1 n
J

son las frecuencias absolutas marginales


de las variables A y B, respectivamente.

n j nij N
j 1

f j
i 1

nij
n

i 1 j 1

son las frecuencias relativas marginales


de las variables A y B, respectivamente.

En las tablas de contingencia:


a) Distribuciones marginales

b) Distribuciones de frecuencias relativas

Estadstica Econmica
2007-2008. Sara Mateo.

c) Perfiles fila

Del total de
individuos con la
caracterstica A1
que porcentaje
comparte a su vez la
B1
d) Perfiles columna

Cmo es lgico, el
porcentaje de
individuos con A1
que, o bien
comparten B1 o B2 y
hasta Bj ser el
100% = 1

Distribucin de una de las variables


siempre que la otra cumpla una
condicin especfica.

xi

ni.
(Frecuencia cuando y=valor especfico)

x1

n1.

x2

n2.

xn-1

nn-1.

xn

nn.

X: Gasto en material escolar


Y: Nmero de hijos
Distrib. Condicionada: Por ejemplo, gasto en material escolar
cuando el nmero de hijos es <3. Tambin podra ser simplemente
cuando y=nmero, slo sera coger esa columna sin sumar nada.

50

100

150

200

Suma de frecuencias
cuando y=0, y=1, y= 2.
Que tienen un gasto de 50.

nij
N

Graves Y
Averias

Leves X

0
1
2
3
4
5

Marginal de Graves

0
0,2308
0,1692
0,0769
0,0923
0,0615
0,0308

1
0,0385
0,0615
0,0385
0,0615
0,0308
0,0077

2
0,0077
0,0231
0,0154
0,0077
0,0000
0,0000

3
Marginal de leves
0,0000
0,2769
0,0077
0,2615
0,0154
0,1462
0,0154
0,1769
0,0077
0,1000
0,0000
0,0385

0,6615

0,2385

0,0538

0,0462

ni.
N

n. j
N

Si

nij
ni . n. j

N N
N

Estadstica Econmica
2007-2008. Sara Mateo.

ij Independencia
Representacin grfica: Nube de
puntos o diagrama de dispersin

Var ( X )

2
(
x

x
)
ni
i
i 1

Varianza de X

S X2
k

Varianza de Y

Cov( X , Y )

Var (Y )

( x x )( y
i 1 j 1

Estadstica Econmica
2007-2008. Sara Mateo.

y )nij
S XY

2
(
y

y
)
n j
j
j 1

SY2

Covarianza entre X e Y
Mide si existe asociacin lineal
entre X e Y. Positiva o negativa
pero no la intensidad

Momento

rs con respecto origen:

ars

x
i 1 j 1

r
i

s
j ij

yn

Momento rs con respecto a las medias:


h

mrs

r
s
(
x

x
)
(
y

y
)
nij
i
j
i 1 j 1

Estadstica Econmica
2007-2008. Sara Mateo.

Se efecta la transformacin:

x ' c1 p1 x
y ' c2 p2 y

xi ' c1 p1 xi
y j ' c2 p2 y j

Resultado de las Medias de las nuevas variables

( S X ') p S
2

De las nuevas varianzas:

Estadstica Econmica
2007-2008. Sara Mateo.

2
1

2
X

( SY ') p S

De la nueva covarianza:

2 2
2 Y

S XY ' p1 p2 S XY

Coeficiente de correlacin lineal


El valor de la covarianza depender de los valores de las
variables, por tanto de sus unidades. Para poder eliminar las
unidades y tener una medida adimensional utilizamos el
COEFICIENTE DE CORRELACIN LINEAL ( rxy )

rxy

S xy
SxS y

rxy

siendo invariante frente a transformaciones lineales (cambio de origen


y escala) de las variable.

Propiedades:

Es un coeficiente adimensional
-1 r 1
Si hay relacin lineal positiva r > 0 y prximo a 1
Si hay relacin lineal negativa r < 0 y prximo a -1
Si no hay relacin lineal r se aproxima a 0
Si X e Y son independientes Sxy = 0 y por tanto r = 0

Importante:
Si las dos variables son independientes, su covarianza vale cero. No podemos asegurar lo mismo en sentido contrario. Si
dos variables tienen covarianza cero, no significa que sean independientes. Linealmente NO tienen relacin. Pero pueden
pueden ser dependientes.

VARIABLES CUALITATIVAS
1) Coeficiente de Asociacin Chi-Cuadrado (2):

i 1 j 1

Si

nij eij
eij

nij
eij

Frecuencia observada

ni n j
n

Frecuencia
esperada

2 0 no habr asociacin inexistencia de asociacin

Problema: no tiene lmite superior por lo que no permite


n:

i
c
u
conocer el grado de asociacin.
l
so
o
om

2) Coeficiente C de contingencia de Karl Pearson:

Si C 0
Si C 1

Estadstica Econmica
2007-2008. Sara Mateo.

1
lmite _ mximo 1
min( I , J )
Nunca superior a uno

inexistencia de asociacin
perfecta asociacin entre las variables

Coeficiente de Correlacin por Rangos de Spearman:


El Coeficiente de Correlacin por Rangos de Spearman permite determinar
la correlacin de datos de carcter ordinal midiendo la concordancia o
discordancia entre las clasificaciones.
Formulacin:
Si no hay empates

D: diferencia de valores para las


dos variables.

Interpretacin:
Si = 1: Correlacin por rangos perfecta y positiva. La concordancia entre los
rangos es perfecta
Si = -1: Correlacin por rangos perfecta y negativa. La concordancia entre los
rangos es perfecta
Si = 0: Correlacin por rangos nula. No hay concordancia entre los rangos
Si 0 < < 1: Correlacin por rangos positiva y si -1 < <0: Correlacin por
rangos negativa
Estadstica Econmica
2007-2008. Sara Mateo.

EJEMPLOS EN CLASE

También podría gustarte