Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DISTRIBUCIONES BIDIMENSIONALES
La forma de disponer los valores en este tipo de variables es, o bien en una tabla
con los valores de todas las observaciones y su respectiva frecuencia (tabla de datos
apareados):
xiyj nij
X1y1 n11
…… ……
x1yk n1k
….. ……
xhyk nhk
X/ Y y1 y2 ... yj ... yk n i.
x1 n11 n12 ... n 1j ... n 1k n 1.
x2 n21 n22 ... n 2j ... n 2k n 2.
... ... ... ... ... ... ... ...
xi ni1 ni2 ... n ij ... n ik n i.
... ... ... ... ... ... ... ...
xh nh1 nh2 ... nhj ... n hk nh.
n .j n .1 n .2 ... n .j ... n .k N
nij
La frecuencia relativa conjunta es: f ij
N
y fi j
ij 1
X1 X2 ... Xn
1º observación x11 x21 ... x n1
2º observación x12 x22 ... x n2
... .... ... ... ...
Kº observación x1k x2k x nk
X n i.
x1 n 1.
x2 n 2. k
... ... Donde ni. ni1 ni 2 .... nik = nij
xi n i. j 1
... ...
xh nh.
N
Y n. i
y1 n. 1
y2 n .2
h
... ... Donde n. j nij n2 j .... nhj nij
yi n.j i 1
... ...
yk n.k.
N
Las ni. y las n.j, se denotan frecuencias absolutas marginales, siendo fi. y f.j las
frecuencias relativas marginales respectivamente.
Se cumple que: n
i j
ij ni n j n N
i j
nij nij
La frecuencia relativa condicionada es fi y fj Hay que tener en
j n j i ni.
cuenta que, cuando usamos las frecuencias relativas, la suma ha de ser 1.
nij n i n j
i, j o f ij f i. f . j i, j
N N N
ni. n. j
nij N n. j f
fj
bajo indpendencia
.j
i ni . ni . N
La frecuencia relativa condicionada es igual a la frecuencia relativa marginal, o
sea, sin existencia de condicionante alguno. Una forma sencilla de ver si dos variables son
independientes es comprobar que las filas y columnas de la tabla de frecuencias son
proporcionales. La independencia siempre es mutua, es decir, X e Y son independientes
entre si.
X \ Y 1 2 3
A 0 20 10 30
B 40 0 0 40
40 20 10 70
Cuando los datos son no agrupados, la más usual, es la nube de puntos o diagrama
de dispersión, que consiste en representar los valores de x en abscisas y los de y en
ordenadas. Cada punto es un par (xi,yj). Si la frecuencia fuera distinta de la unitaria, se
haría constar en el gráfico:
nij
a rs x ir y sj
i j N
De todos los momentos ordinarios los más utilizados son:
nij nij n i
a10 x i y 0j xi xi x
i j N i j N i N
a 01 y a 20
x 2
i n i
a 02
y 2
j j n
a11 x i y j
nij
N N i j N
Momentos centrales con respecto a la media (mrs): Son de la forma:
y
nij
mrs x i x
r s
j y
i j N
Los más usados son:
m11 xi x y j y nN ij
S xy
i j
S xy m11 xi x y j y nN
ij
i j
n
N x y
ij
nij nij nij nij
S xy m11 x i x y j y x y j y xi xy
i j
i j
i j i j N i j N i j N N
a11 xy yx xy a11 xy a11 a10 a 01
nij ni n j n n j
a11 xi y j xi y j
indep
xi i y j a10a01 m11 0
i j N i j N N i N j N
En cuanto a las transformaciones en las variables, es fácil deducir que los cambios
de origen –al igual que en la varianza- no la afectan, pero sí los de escala. Por lo cual ante
una transformación lineal en las variables, la covarianza queda afectada de la siguiente
forma:
x a1 b1 x y a2 b2 y
S x y xi x y j y nN b b x xy
ij
1 2 i j y nN b b S
ij
1 2 xy
i j i j
Se calcula : S xy
x y ni j ij
xy
N
…………………………………………………………………..….Cristóbal Rojas Montoya 9
La covarianza tiene como inconvenientes que depende de las unidades de medida,
y que puede tomar cualquier valor (no esta acotada).
S xy
rxy
SxS y
Es adimensional
x a1 b1 x y a2 b2 y
S x y b1 b2 S xy S xy
rx y rxy
S x S y b1 S x b2 S y Sx S y
En el caso de que alguna variable tenga algún valor muy dispar (outlier),
podría desvirtuar el valor de r, y puede ser más conveniente eliminarlo.