Está en la página 1de 6

Distribuciones Bidimensionales ( L

A
T
E
X)
Ein Lehrer
Artculos varios.
Chile
August 9, 2014
1 Distribuciones de Frecuencia Bidimensionales
Estudiaremos dos caractersticas de un mismo elemento de la poblacin (Por ejemplo, estatura y peso,
calicaciones en dos asignaturas, nivel de ingreso versus nivel de estudios, etc.).
De forma general, si se estudian sobre una misma poblacin una variable X y una variable Y , se
obtienen series estadsticas de las variables X e Y . Considerando simultneamente las dos series, se dice
que estamos ante una variable estadstica bidimensional.
Cada variable considerada puede ser cualitativa o cuantitativa, discreta o continua. Ambas pueden
ser del mismo tipo y, por supuesto, pueden ocurrir tambin mezclas de tipos.
Observacin
Esto se puede generalizar a ms variables.
A veces se sabe a priori que las variables estn relacionadas. Por ello, muchas veces este anlisis
se realiza para conrmar que efectvamente existe una relacin, o bien para descartar que se
encuentren relacionadas.
1.1 Tabulacin
La informacin se tabula en una matriz de doble entrada. Por ejemplo, si consideramos una poblacin
estudiada segn dos variables X e Y , denimos la matriz (x
i
, y
j
, f
ij
), en que x
i
e y
j
son dos valores de
X e Y respectivamente, y f
ij
es la frecuencia absoluta conjunta o simultnea del valor i-simo de X con
el j-simo de Y (es decir, cantidad de veces que aparece el par (x
i
, y
j
) en la muestra/poblacin).
1.2 Ejemplo
En una empresa trabajan 95 personas. Cada uno de ellos fue clasicado de acuerdo a su sueldo y los aos
de antigedad en la empresa. Por ejemplo, hay 1 funcionario que gana 90 unidades monetarias (u.m.)
y tiene 1 ao de antigedad. Hay 2 funcionarios que ganan 90 u.m. y tienen 3 aos de antigedad, etc.
Los resultados completos de la clasicacin se presentan en la tabla siguiente:
1
X/Y 1 3 5 7 9 11 f
x
i
h
x
i
90 1 2 1 1 0 0 5 0,053
110 2 4 4 5 2 1 18 0,189
130 1 7 3 1 2 0 14 0,147
150 4 6 6 4 3 0 23 0,242
170 2 3 4 6 4 1 20 0,211
190 0 0 2 5 5 3 15 0,158
f
y
j
10 22 20 22 16 5 95
h
y
j
0,105 0,232 0,211 0,232 0,168 0,053 1
En base a la tabla, conteste:
1. Cuntos funcionarios ganan 170 y llevan 7 aos en la empresa?
2. Cuntos funcionarios ganan 150?
3. Cuntos funcionarios llevan 9 aos en la empresa?
4. Cmo se calcula f
x
i
y h
x
i
?
5. Cunto es el promedio de sueldo? Cunto es el promedio de antigedad?
6. Cunto es la varianza de sueldo? Cunto es la varianza de antigedad?
Recordemos el clculo de la media ( x) para variables agrupadas (muestra/poblacin):
x =

i
f
i
x
i
n
x =

i
f
i
x
i
N
Y tambin el clculo de la varianza (s
2
o
2
) para variables agrupadas:
s
2
=

i
f
i
(x
i
x)
2
n 1

2
=

i
f
i
(x
i
x)
2
N
Desarrollando algebricamente, se obtiene una frmula ms sencilla para este clculo. Esto queda:
s
2
=

i
f
i
(x
i
)
2
n x
2
n 1

2
=

i
f
i
(x
i
)
2
N
x
2
En consecuencia, para nuestro ejemplo, el promedio de sueldo es:
x =
5 90 + 18 110 + 14 130 + 23 150 + 20 170 + 15 190
95
= 146, 84 u.m.
El promedio de antigedad:
y =
10 1 + 22 3 + 20 5 + 22 7 + 16 9 + 5 11
95
= 5, 57 aos
La varianza de sueldo es:

2
X
=
5 90
2
+ 18 110
2
+ 14 130
2
+ 23 150
2
+ 20 170
2
+ 15 190
2
95
146, 84
2
= 879, 07 u.m.
2
2
La varianza de antigedad:

2
Y
=
10 1
2
+ 22 3
2
+ 20 5
2
+ 22 7
2
+ 16 9
2
+ 5 11
2
95
5, 57
2
= 7, 79 aos
2
Para efectuar todos estos clculos (promedios y varianzas) hemos utilizado las frecuencias acumuladas
de X (sin considerar Y ) y las de Y (sin considerar X). A estas frecuencias se les denomina frecuencias
marginales.
Analicemos ahora la distribucin del sueldo pero considerando nicamente aquellos empleados que
tienen 5 aos en la empresa. Esto es, cul es la distribucin de la variable X condicionada a que Y sea
igual a 5. Corresponde a la siguiente tabla:
X/Y f
x
i
/Y = 5 h
x
i
/Y = 5
90 1 0,05
110 4 0,20
130 3 0,15
150 6 0,30
170 4 0,20
190 2 0,10
20 1
En base a la tabla, conteste:
1. Cuntos funcionarios ganan 170 y llevan 5 aos en la empresa?
2. Cuntos funcionarios llevan 5 aos en la empresa?
3. Cmo se obtiene f
x
i
/Y = 5? (Observacin: Esto tambin se denota en forma ms concisa como
f
x
i
/5
).
4. Cmo se calcula h
x
i
/Y= 5? (Observacin: Tambin se denota como h
x
i
/5
).
5. Cunto es el promedio y varianza de sueldo para los funcionarios con 5 aos?
6. Cunto es el promedio de antigedad para los funcionarios con 5 aos?
El promedio y varianza de sueldo para los funcionarios con 5 aos es:
x
/Y=5
=
1 90 + 4 110 + 3 130 + 6 150 + 4 170 + 2 190
20
= 144 u.m.

2
X/Y=5
=
1 90
2
+ 4 110
2
+ 3 130
2
+ 6 150
2
+ 4 170
2
+ 2 190
2
20
144
2
= 764 u.m.
2
Ejercicios adicionales.
1. Tabule la frecuencia condicional de Y , para un sueldo de X = 130
2. Tabule la frecuencia marginal de Y
3. Tabule la frecuencia conjunta relativa de X e Y
3
1.3 Distribuciones presentes en una Distribucin Bidimensional
Cuando se estudian conjuntamente dos variables, surgen tres tipo de distribuciones: Distribucin con-
junta, distribuciones marginales y distribuciones condicionadas.
1.3.1 Distribucin Conjunta
frecuencia absoluta conjunta
viene determinada por el nmero de veces que aparece el par ordenado (x
i
, y
j
), y se representa por
f
ij
frecuencia relativa conjunta
asociada al par (x
i
, y
j
) es el cociente entre la frecuencia absoluta conjunta y el nmero total de
observaciones:
h
ij
=
f
ij
N
1.3.2 Distribuciones Marginales
Cuando trabajamos con ms de una variable y queremos calcular las distribuciones de frecuencias de
cada una de manera independiente, nos encontramos con las distribuciones marginales.
frecuencia absoluta marginal
La frecuencia absoluta marginal de la variable X, corresponde al nmero de veces que aparece
cada valor x
i
de X, sin tener en cuenta cul es el valor de la variable Y . Es decir:
f
x
i
=

k
f
ik
Esto corresponde a totalizar sobre las columnas de la matriz.
Anlogamente, la frecuencia absoluta marginal de la variable Y , corresponde al nmero de veces
que aparece cada valor y
j
de Y , sin tener en cuenta cul es el valor de la variable X. Es decir:
f
y
j
=

k
f
kj
Lo que corresponde a totalizar sobre las las de la matriz.
frecuencia relativa marginal
La frecuencia relativa marginal de la variable X, corresponde a:
h
x
i
=
f
x
i
N
Por su parte, la frecuencia relativa marginal de la variable Y , corresponde a:
h
y
j
=
f
y
j
N
4
1.3.3 Distribuciones Condicionales o Condicionadas
Consideremos los f
y
j
elementos de la poblacin/muestra que presentan la caracterstica y
j
de la variable
Y . Estos elementos constituyen una poblacin que es un subconjunto de la poblacin/muestra total.
Sobre este subconjunto se dene la distribucin de X condicionada por y
j
, que se representa como
X / Y= y
j
o ms brevemente como
X/y
j
y se lee como distribucin de X dado que Y es igual a y
j
.
Anlogamente se dene la distribucin de Y dado que X es igual a x
i
.
Y/x
i
frecuencia absoluta condicional
La frecuencia absoluta condicional de X para un y
j
determinado es:
f
x
i
/y
j
= f
ij
(considerando jo el j)
Lo que corresponde a una columna determinada dentro de la tabla.
Del mismo modo, la frecuencia absoluta condicional de Y para un x
i
determinado es:
f
y
j
/x
i
= f
ij
(considerando jo el i)
Lo que corresponde a una la de la tabla.
frecuencia relativa condicional
Recordemos que en las distribuciones condicionales el universo de elementos corresponde a aquellos
que cumplen con la condicin elegida (por ejemplo, si elegimos la caracterstica y
j
, existen f
y
j
elementos en dicho conjunto). En consecuencia, la frecuencia relativa condicional de de X para
un y
j
determinado es:
h
x
i
/y
j
=
f
x
i
/y
j
f
y
j
(considerando jo el j)
Anlogamente, la frecuencia relativa condicional de de Y para un x
i
determinado es:
h
y
j
/x
i
=
f
y
j
/x
i
f
x
i
(considerando jo el i)
1.4 Promedios, Varianzas y Covarianzas
Tal como hemos visto, se pueden calcular Promedios y Varianzas para las distribuciones marginales y
las condicionales.
En el caso de las distribuciones conjuntas se calcula la Covarianza, que corresponde a una medida
de dispersin conjunta de los datos. Esto es, la covarianza mide la forma en que varan conjuntamente
dos variables X e Y .
En el estudio conjunto de dos variables, lo que nos interesa principalmente es saber si existe algn
tipo de relacin entre ellas. La covarianza nos ayuda a medir o cuanticar esta relacin.
5
Se dene covarianza de X e Y como:
s
2
XY
=

j
f
ij
(x
i
x)(y
j
y)
n 1

2
XY
=

j
f
ij
(x
i
x)(y
j
y)
N
donde x y y corresponden al promedio de X e Y respectivamente (como hemos visto, estos promedios
se calculan utilizando las distribuciones marginales de X e Y ). Adems, tal como en el caso de la
varianza, con un poco de lgebra se obtiene una versin ms simple. Esto es:
s
2
XY
=

j
f
ij
x
i
y
j
n x y
n 1

2
XY
=

j
f
ij
x
i
y
j
N
x y
La interpretacin de la covarianza es la siguiente:
covarianza > 0 : Hay dependencia directa (positiva), es decir las variaciones de las variables
tienen el mismo sentido (ambas crecen o decrecen en forma simultnea).
covarianza < 0 : Hay dependencia inversa o negativa, es decir las variaciones de las variables
tienen sentido inverso (si una crece la otra decrece y viceversa).
covarianza = 0 : Las variables no tienen una correlacin lineal, pero podra existir otro tipo de
relacin. Se requieren otros indicadores y anlisis adicionales.
1.4.1 Ejemplo
Sea X el tiempo de vida de un insecto (aos) e Y la longitud del mismo (cm). Se muestran los estadsticos
de su poblacin. Analizar si existe relacin entre la "edad" del insecto y su tamao.
X/Y 2 3 4 f
x
i
1 3 1 0 4
2 1 3 1 5
3 0 1 3 4
f
y
j
4 5 4 13
Para efectuar el anlisis, determinaremos la covarianza de X e Y . Para ello, en primer lugar, calcular
los promedios de "edad" y tamao.
x =
4 1 + 5 2 + 4 3
13
= 2 aos
y =
4 2 + 5 3 + 4 4
13
= 3 cm
Y la covarianza es:

2
XY
=
3 1 2 + 1 1 3 + 0 1 4 + 1 2 2 + 3 2 3 + 1 2 4 + 0 3 2 + 1 3 3 + 3 3 4
13
23
Es decir:

2
XY
= 0, 462 aos.cm
Y como
2
XY
= 0, 462 es mayor que 0, signica que la "edad" y el tamao del insecto tienen una
correlacin directa o positiva, es decir, cuando aumenta la "edad" del insecto tambin aumenta su
tamao.
References
[1] Ruiz Muoz, David - Manual de Estadstica (2004)
6

También podría gustarte