Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DISTRIBUCIONES BIDIMENSIONALES
Hasta ahora hemos estudiado la distribución de una variable que nos expresaba la medida de un
carácter cuantitativo/cualitativo. Pero también podemos estudiar simultáneamente dos o más.
Así por ejemplo se puede medir el consumo de un individuo en función de su renta.
Un fenómeno que tiene dos o más características observables con la intención de explicar el
comportamiento de una de ellos a partir de otra u otras
o Ejemplo 1. Fenómeno: familia
o Características: nº. de componentes, renta, gasto, nº. de teléfonos móviles,
edad del cabeza de familia, lugar de residencia …
Además no solo nos conformaremos con descubrir si existe o no relación sino que buscaremos
medir su grado ya que este puede ser desde fuerte (relación máxima o matemática) a nula (no
existencia de relación).
1
Julio Hernández March y Miguel Ángel Marcos Estadística
Análisis estadístico de dos variables
Distribuciones Bidimensionales
Y Y
𝑦 𝑓 𝑥
𝑦 𝑎 + 𝑏𝑥
X X
Pues bien, se llama variable estadística bidimensional al conjunto de pares de valores (X,Y) en
que se puede concretar una observación conjunta cualquiera, ya sea procedente de dos
características de un mismo fenómeno o de dos fenómenos.
2
Julio Hernández March y Miguel Ángel Marcos Estadística
Análisis estadístico de dos variables
Distribuciones Bidimensionales
Llamamos distribución conjunta de la variable (X,Y) al conjunto de observaciones [(xi, yj) ; nij ]
i=1..h j=1..k una vez ordenadas en una tabla que llamaremos de correlación cuando ambas variables
sean cuantitativas y de contingencia en caso de que alguna o las dos sean atributos.
∑∑
Cuando las frecuencias absolutas conjuntas nij se dividen entre N se obtienen frecuencias
relativas conjuntas, ofreciendo otra forma de definir una distribución conjunta de frecuencias:
Puede ocurrir que nos interese, a partir de la distribución bidimensional (conjunta) estudiar
aisladamente cada una de las variables. De esta forma tendíamos dos distribuciones
unidimensionales, que serían las distribuciones de X y de Y, llamadas distribuciones marginales.
Para X:
x1 n1. f1.
x2 n2. f2.
3
Julio Hernández March y Miguel Ángel Marcos Estadística
Análisis estadístico de dos variables
Distribuciones Bidimensionales
... … …
xi ni. fi.
… … …
xh nh. fh.
Total N 1
+ + + + + ∑
Y que: ∑
+ + + + + ∑
Y que: ∑
Para Y:
y1 n.1 f.1
y2 n.2 f.2
... … …
yi n.j f.j
… … …
yk n.k f.k
Total N 1
Cumpliéndose:
4
Julio Hernández March y Miguel Ángel Marcos Estadística
Análisis estadístico de dos variables
Distribuciones Bidimensionales
+ + + + + ∑
+ + + + + ∑
∑∑
Y que:
∑∑
Son distribuciones unidimensionales que surgen al fijar en una variable bidimensional (X,Y) un
valor de una de las variables (condicionante) y considerar la distribución de valores de la otra
(condicionada). Es decir, se forman fijando previamente una condición.
x1 n1j f1/j
x2 n2j f2/j
... … …
xi nij fi/j
5
Julio Hernández March y Miguel Ángel Marcos Estadística
Análisis estadístico de dos variables
Distribuciones Bidimensionales
… … …
xh nhj fh/j
Total n.j 1
Donde:
+ + + + + ∑
(únicamente se consideran
las frecuencias absolutas vinculadas a la condición.)
y1 ni1 f1/i
y2 ni2 f2/i
... … …
yj nij fj/i
… … …
yk nik fk/i
Total ni. 1
Cumpliéndose:
+ + + + + ∑
6
Julio Hernández March y Miguel Ángel Marcos Estadística
Análisis estadístico de dos variables
Distribuciones Bidimensionales
En el primer caso estamos afirmando que la variable X no afecta para nada a la variable Y,
mientras que en el segundo decimos que la variable Y no afecta para nada a la variable X
En la práctica es muy difícil que se cumpla esta condición, aunque las variables no tengan nada
que ver
Lo habitual en estadística es trabajar con variables cuyo grado de dependencia está comprendido
entre los dos extremos que acabamos de enunciar: la independencia estadística y la dependencia
funcional.
¿Qué problemas nos vamos a plantear? En este contexto, trataremos de analizar la relación
entre las variables, tanto en lo que respecta a la forma funcional que resulta más adecuada
como al grado de intensidad de la misma.
7
Julio Hernández March y Miguel Ángel Marcos Estadística
Análisis estadístico de dos variables
Distribuciones Bidimensionales
4.6 MOMENTOS
∑ ∑
̅ ̅
∑ ∑ ∑
∑ ̅ ̅
∑ ̅
̅
∑ ̅
̅ =
∑ ̅ ̅ ∑
̅̅
∑ ∑
∑∑
8
Julio Hernández March y Miguel Ángel Marcos Estadística
Análisis estadístico de dos variables
Distribuciones Bidimensionales
∑∑ ̅ ( ̅)
COVARIANZA
Al momento
∑∑ ̅ ( ̅)
se le llama covarianza y es una medida del grado de asociación lineal entre las variables X e Y.
Veamos el porqué:
En virtud de ello, una relación lineal positiva entre las variables, como la indicada en el gráfico,
conllevará la existencia de más puntos en los cuadrantes I y III y menos en los cuadrantes II y IV,
determinando una covarianza positiva. En el caso de una relación lineal perfecta todos los puntos
se situarían en los cuadrantes I y III y la covarianza alcanzaría su valor más alto.
De manera análoga, una covarianza negativa nos informaría de una relación lineal negativa entre
las variables, a partir de la cual valores altos en una de las variables se corresponden con
valores bajos en la otra.
Por lo tanto, una covarianza grande en valor absoluto indicará un mayor grado de asociación
lineal entre las variables. Por otra parte, el signo determinará el sentido de la relación: el mismo
si es positivo, el contrario si es negativo.
9
Julio Hernández March y Miguel Ángel Marcos Estadística
Análisis estadístico de dos variables
Distribuciones Bidimensionales
10
Julio Hernández March y Miguel Ángel Marcos Estadística
Análisis estadístico de dos variables
Distribuciones Bidimensionales
yj
x i
- x 0 y j - y 0 x - x 0 y - y 0
i j
·
· · ··
II · · · I
· · · ··
y ··
III · · · IV
· · ·
·· · x i
- x 0 y j - y 0
x i
- x 0 y j - y 0 x
xi
11
Julio Hernández March y Miguel Ángel Marcos Estadística
Análisis estadístico de dos variables
Distribuciones Bidimensionales
Ejemplo: Supongamos que del fenómeno familia se estudian las variables número de miembros
de la unidad familiar (X) y número de teléfonos móviles (Y). Para ello se seleccionan 35 familias y
se les pregunta por ambas variables. Una vez agrupadas las parejas de observaciones de la
variable (X,Y) en una tabla de correlación, el resultado ha sido:
Tabla de correlación
Y
X 0 1 2 3 4 ni.
1 1 6 2 0 0 9
2 0 2 6 1 0 9
3 0 0 5 3 1 9
4 0 0 3 4 1 8
n.j 1 8 16 8 2 35
Distribuciones marginales:
X:
xi ni. fi.
1 9 0,2571
2 9 0,2571
3 9 0,2571
4 8 0,2286
Totales 35 1,0000
Y:
yj n.j f.j
0 1 0,0286
1 8 0,2286
2 16 0,4571
3 8 0,2286
4 2 0,0571
Totales 35 1,0000
Distribuciones condicionadas (ejemplos):
12
Julio Hernández March y Miguel Ángel Marcos Estadística
Análisis estadístico de dos variables
Distribuciones Bidimensionales
Y/X=2
yj nj/i=2 fj/i=2
0 0 0,0000
1 2 0,2222
2 6 0,6667
3 1 0,1111
4 0 0,0000
Totales 9 1,0000
X/Y=3
xi ni/j=3 fi/j=3
1 0 0,0000
2 1 0,1250
3 3 0,3750
4 4 0,5000
Totales 8 1,0000
13