Está en la página 1de 16

Capítulo 6

Distribuciones de frecuencias
bidimensionales
Contenidos:

 Distribución bidimensional de frecuencias


 Representaciones gráficas
 Momentos en distribuciones bidimensionales
 Método reducido para el cálculo de varianzas y covarianzas
 Valor de la covarianza en caso de independencia estadística
 Coeficiente de correlación lineal
 Coeficientes de Asociación para variables nominales: Chi-Cuadrado
y C de contingencia

Estadística Económica
2007-2008. Sara Mateo.
Tabla de Correlación o
Contingencia (atributos)
(al final del capítulo)
Tabla de Correlación o Contingencia
Permite ayudarnos a determinar si existe relación de interdependencia
entre 2 variables, es decir, si se influyen mutuamente.

donde nij es el número de


observaciones que presentan
simultáneamente las
características i, j de las variables A
y B, respectivamente.

Así, una tabla de contingencia es una una tabla de doble


entrada, donde en cada casilla figurará el número de casos
o individuos que poseen un nivel de una de las
características analizadas y otro nivel de la otra
característica.
Al analizar una distribución bidimensional, uno puede centrar su
estudio en el comportamiento de una de las variables, con
independencia de como se comporta la otra. Estaríamos así en el
análisis de una distribución marginal.

Distribución marginal de A Distribución marginal de B


Ai ni. Bj n.j
A1 n1. B1 n.1
A2 n2. B2 n.2
… … … …
An-1 nn-1. Bm-1 n.m-1
An nn. Bm n.m
Distribuciones marginales
k
ni  ni1  ni 2  ni 3  ...  nij  ...  nik   nij
j 1
h
n j  n1 j  n2 j  n3 j  ...  nij  ...  nhj   nij
i 1
Definimos:

J
ni    nij
I
n j   nij son las frecuencias absolutas marginales
j 1 de las variables A y B, respectivamente.
i 1

h k h k

n
i 1
i   n j   nij  N
j 1 i 1 j 1

J nij I nij
fi    f j   son las frecuencias relativas marginales
j 1 n i 1 n de las variables A y B, respectivamente.
En las tablas de contingencia:
a) Distribuciones marginales

b) Distribuciones de frecuencias relativas

Estadística Económica
2007-2008. Sara Mateo.
c) Perfiles fila

Del total de
individuos con la
característica “A1”
que porcentaje
comparte a su vez la
“B1”
d) Perfiles columna
Cómo es lógico, el
porcentaje de
individuos con “A1”
que, o bien
comparten B1 o B2 y
hasta Bj será el
100% = 1
Distribución de una de las variables
siempre que la otra cumpla una
condición específica.

xi ni.
(Frecuencia cuando y=valor específico)

x1 n1.
x2 n2.
… …
xn-1 nn-1.
xn nn.

X: Gasto en material escolar


0 5
Y: Número de hijos 50 8
Distrib. Condicionada: Por ejemplo, gasto en material escolar 100 5
cuando el número de hijos es <3. También podría ser simplemente 150 8 Suma de frecuencias
cuando y=número, sólo sería coger esa columna sin sumar nada. cuando y=0, y=1, y= 2.
200 4
Que tienen un gasto de 50.
nij
N Averias 0 1
Graves Y
2 3 Marginal de leves
0 0,2308 0,0385 0,0077 0,0000 0,2769

Leves X
1
2
0,1692
0,0769
0,0615
0,0385
0,0231
0,0154
0,0077
0,0154
0,2615
0,1462 ni.
3 0,0923 0,0615 0,0077 0,0154 0,1769
4
5
0,0615
0,0308
0,0308
0,0077
0,0000
0,0000
0,0077
0,0000
0,1000
0,0385
N
Marginal de Graves
0,6615 0,2385 0,0538 0,0462 1

n. j
N

ni. n. j nij
Si  ij  Independencia
N N N
Representación gráfica: Nube de
Estadística Económica
puntos o diagrama de dispersión
2007-2008. Sara Mateo.
h

 i
( x  x ) 2
ni Varianza de X
Var ( X )  i 1
 S X2
N
k

 j
( y
j 1
 y ) 2
n j
Varianza de Y Var (Y )   SY2
N

h k

 ( x  x )( y
i 1 j 1
i j  y )nij
Covarianza entre X e Y
Cov( X , Y )   S XY
N Mide si existe asociación lineal
entre X e Y. Positiva o negativa
Estadística Económica
2007-2008. Sara Mateo. pero no la intensidad
h k

 x
Momento rs con respecto origen: r s
i yn
j ij
i 1 j 1
ars 
N

Momento rs con respecto a las medias:


h k

 i
( x  x
i 1 j 1
) r
( y j  y ) s
nij
mrs 
N
Estadística Económica
2007-2008. Sara Mateo.
xi '  c1  p1 xi
Se efectúa la transformación:
y j '  c2  p2 y j

x '  c1  p1 x
Resultado de las Medias de las nuevas variables
y '  c2  p2 y
( S X ')  p S
2 2
1
2
X
De las nuevas varianzas:
( SY ')  p S
2 2 2
2 Y

Estadística Económica De la nueva covarianza: S XY '  p1 p2 S XY


2007-2008. Sara Mateo.
Coeficiente de correlación lineal
El valor de la covarianza dependerá de los valores de las
variables, por tanto de sus unidades. Para poder eliminar las
unidades y tener una medida adimensional utilizamos el
COEFICIENTE DE CORRELACIÓN LINEAL ( rxy )
S xy
rxy 
SxS y
rxy
siendo invariante frente a transformaciones lineales (cambio de origen
y escala) de las variable.
•Es un coeficiente adimensional
• -1  r  1
•Si hay relación lineal positiva r > 0 y próximo a 1
Propiedades:
•Si hay relación lineal negativa r < 0 y próximo a -1
•Si no hay relación lineal r se aproxima a 0
•Si X e Y son independientes Sxy = 0 y por tanto r = 0
Importante:
Si las dos variables son independientes, su covarianza vale cero. No podemos asegurar lo mismo en sentido contrario. Si
dos variables tienen covarianza cero, no significa que sean independientes. Linealmente NO tienen relación. Pero pueden
pueden ser dependientes.
VARIABLES CUALITATIVAS

1) Coeficiente de Asociación Chi-Cuadrado (χ2):

nij
I J
nij  eij 
2  Frecuencia observada

  2
 eij ni  n j
i 1 j 1 eij  Frecuencia
n esperada

Si  2 ≈ 0 no habrá asociación  inexistencia de asociación

Problema: no tiene límite superior por lo que no permite


conocer el grado de asociación.
2) Coeficiente “C” de contingencia de Karl Pearson:

 2
1
C lím ite _ m áxim o 1 
2 n min(I , J )
Nunca superior a uno

Si C ≈0 inexistencia de asociación
Si C ≈1 perfecta asociación entre las variables

Estadística Económica
2007-2008. Sara Mateo.
Coeficiente de Correlación por Rangos de Spearman:

• El Coeficiente de Correlación por Rangos de Spearman permite determinar


la correlación de datos de carácter ordinal midiendo la concordancia o
discordancia entre las clasificaciones.

• Formulación:
Si no hay empates

D: diferencia de valores para las


dos variables.
• Interpretación:

 Si ρ= 1: Correlación por rangos perfecta y positiva. La concordancia entre los


rangos es perfecta
Si ρ = -1: Correlación por rangos perfecta y negativa. La concordancia entre los
rangos es perfecta
Si ρ = 0: Correlación por rangos nula. No hay concordancia entre los rangos
Si 0 < ρ < 1: Correlación por rangos positiva y si -1 < ρ <0: Correlación por
rangos negativa

Estadística Económica EJEMPLOS EN CLASE


2007-2008. Sara Mateo.

También podría gustarte