Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TABULACIÓN Y
REPRESENTACIÓN GRÁFICA
DE DATOS BIVARIANTES
ÍNDICE
● INTRODUCCIÓN
● DISTRIBUCIÓN DE FRECUENCIAS CONJUNTA
● DISTRIBUCIONES MARGINALES
● DISTRIBUCIONES CONDICIONADAS
● REPRESENTACIONES GRÁFICAS
● DEPENDENCIA E INDEPENDENCIA ESTADÍSTICA.
TIPOS DE DEPENDENCIA
INTRODUCCIÓN
● Temas anteriores: Tratamiento estadístico de una
única variable
● Ahora: Estudiar simultáneamente distintas
características de los individuos
● Ejemplo: Análisis de la situación socioeconómica de
las familias de una ciudad según:
- Tamaño familiar,
- Gastos e ingresos
- Nivel de instrucción
- Características de la vivienda, etc.
● Proporciona: Visión más enriquecedora de la
realidad.
● Estudiar si distintas variables se influyen
mutuamente: ¿Afecta el salario del cabeza de familia
a la estructura de gasto de la misma?
INTRODUCCIÓN
● Ejemplo
X\Y y1 y2 … yj … yh
x1 f11 f12 … f1j … f1h
x2 f21 f22 … f2j … f2h
… … … … … … …
xi fi1 fi2 … fij … fih
… … … … … … …
xk fk1 fk2 … fkj … fkh
DISTRIBUCIÓN DE FRECUENCIAS CONJUNTA
● Frecuencias conjuntas absolutas y relativas
● Ejemplo
Secundaria Bachillerato Universitarios
1000 - 1500 18 9 3
1500 - 2000 15 24 6
2000 - 2500 6 19 15
2500 - 3000 1 3 6
. .
. .
DISTRIBUCIONES MARGINALES
● Distribución marginal de X
X\Y y1 y2 … yj … yh ni.
x1 n11 n12 … n1j … n1h n1.
x2 n21 n22 … n2j … n2h n2.
… … … … … … … …
xi ni1 ni2 … nij … nih ni.
… … … … … … … …
xk nk1 nk2 … nkj … nkh nk.
n.j n.1 n.2 … n.j … n.h N
DISTRIBUCIONES MARGINALES
● Distribución marginal de Y
X\Y y1 y2 … yj … yh ni.
x1 n11 n12 … n1j … n1h n1.
x2 n21 n22 … n2j … n2h n2.
… … … … … … … …
xi ni1 ni2 … nij … nih ni.
… … … … … … … …
xk nk1 nk2 … nkj … nkh nk.
n.j n.1 n.2 … n.j … n.h N
DISTRIBUCIONES MARGINALES
● Distribuciones marginales en términos relativos
.
.
.
.
.
.
DISTRIBUCIONES MARGINALES
X\Y y1 y2 … yj … yh fi.
x1 f11 f12 … f1j … f1h f1.
x2 f21 f22 … f2j … f2h f2.
… … … … … … … …
xi fi1 fi2 … fij … fih fi.
… … … … … … … …
xk fk1 fk2 … fkj … fkh fk.
f.j f.1 f.2 … f.j … f.h 1
DISTRIBUCIONES CONDICIONADAS
● Ejercicio
Secundaria Bachillerato Universitarios ni.
1000 - 1500 18 9 3 30
1500 - 2000 15 24 6 45
2000 - 2500 6 19 15 40
2500 - 3000 1 3 6 10
n.j 40 55 30 125
X\Y y1 y2 … yj … yh ni.
x1 n11 n12 … n1j … n1h n1.
x2 n21 n22 … n2j … n2h n2.
… … … … … … … …
xi ni1 ni2 … nij … nih ni.
… … … … … … … …
xk nk1 nk2 … nkj … nkh nk.
n.j n.1 n.2 … n.j … n.h N
DISTRIBUCIONES CONDICIONADAS
● Distribuciones de X condicionadas por cada valor Y=yj:
/
.
X\Y y1 y2 … yj … yh Marginal X
x1 fX=x1|Y=y1 fX=x1|Y=y2 … fX=x1|Y=yj … fX=x1|Y=yh f1.
x2 fX=x2|Y=y1 fX=x2|Y=y2 … fX=x2|Y=yj … fX=x2|Y=yh f2.
… … … … … … … …
xi fX=xi|Y=y1 fX=xi|Y=y2 … fX=xi|Y=yj … fX=xi|Y=yh fi.
… … … … … … … …
xk fX=xk|Y=y1 fX=xk|Y=y2 … fX=xk|Y=yj … fX=xk|Y=yh fk.
Total 1 1 … 1 … 1 1
DISTRIBUCIONES CONDICIONADAS
● Distribuciones de Y condicionadas por cada valor X = xi:
X\Y y1 y2 … yj … yh ni.
x1 n11 n12 … n1j … n1h n1.
x2 n21 n22 … n2j … n2h n2.
… … … … … … … …
xi ni1 ni2 … nij … nih ni.
… … … … … … … …
xk nk1 nk2 … nkj … nkh nk.
n.j n.1 n.2 … n.j … n.h N
DISTRIBUCIONES CONDICIONADAS
● Distribuciones de Y condicionadas por cada valor X = xi:
o
X\Y y1 y2 … yj … yh ni.
x1 n11 n12 … n1j … n1h n1.
x2 n21 n22 … n2j … n2h n2.
… … … … … … … …
xi ni1 ni2 … nij … nih ni.
… … … … … … … …
xk nk1 nk2 … nkj … nkh nk.
n.j n.1 n.2 … n.j … n.h N
X\Y y1 y2 … yj … yh ni.
xi ni1 ni2 … nij … nih ni.
DISTRIBUCIONES CONDICIONADAS
● Perfiles fila
/
.
X\Y y1 y2 … yj … yh Total
x1 fY=y1|X=x1 fY=y2|X=x1 … fY=yj|X=x1 … fY=yh|X=x1 1
x2 fY=y1|X=x2 fY=y2|X=x2 … fY=yj|X=x2 … fY=yh|X=x2 1
… … … … … … … …
xi fY=y1|X=xi fY=y2|X=xi … fY=yj|X=xi … fY=yh|X=xi 1
… … … … … … … …
xk fY=y1|X=xk fY=y2|X=xk … fY=yj|X=xk … fY=yh|X=xk 1
Marginal Y f.1 f.2 … f.j … f.h 1
DISTRIBUCIONES CONDICIONADAS
● Ejemplo
○ | .
○ . .
● Estas condiciones son equivalentes. Si se verifica una de ellas,
lo hacen las otras dos
● La primera condición significa que todas las distribuciones de
X condicionadas coinciden con la distribución marginal de X
● La segunda implica que todas las distribuciones de Y
condicionadas coinciden con la distribución marginal de Y.
● La tercera indica que las frecuencias conjuntas relativas
coinciden con el producto de las correspondientes
marginales relativas
DEPENDENCIA E INDEPENDENCIA ESTADÍSTICA
● Salario y nivel educativo
Distribución conjunta del salario y el
nivel educativo
Secundaria Bachillerato Universitarios
1000 -
1500 14,4% 7,2% 2,4% 24,0%
1500 -
2000 12,0% 19,2% 4,8% 36,0%
2000 -
2500 4,8% 15,2% 12,0% 32,0%
2500 -
3000 0,8% 2,4% 4,8% 8,0%
32,0% 44,0% 24,0% 100,0%
Hombres Mujeres
No Fumador 30 45
Ocasional 10 15
Habitual 36 54
Empedernido 24 36
DEPENDENCIA E INDEPENDENCIA ESTADÍSTICA
0% 0%
Hombre Mujer Marg. X. Hombre Mujer Marg. X.
Distribución del sexo dado el nivel Distribución del sexo dado el nivel
en el hábito de fumar en el hábito de fumar
100% 100%
50% 50%
0% 0%
𝟐• •𝟏 𝟐𝟏
NO independientes
estadísticamente
• •
DEPENDENCIA E INDEPENDENCIA ESTADÍSTICA
● Ejemplo: Tamaño y sector de un conjunto de compañías
● A partir de los perfiles fila: Distribución del sector
dado el tamaño
Comercial Industrial Servicios TOTAL
Pequeña 81% 5% 14% 100%
Media 0% 96% 4% 100%
Grande 6% 9% 86% 100%
Marginal Y 32% 32% 36% 100%
No representativo
S
Ejercicio
b) ¿Cuál es el número medio de días al año que los
trabajadores de más de 30 años trabajadores están de baja por
enfermedad? ¿Y el número mediano de días? ¿Y el número
más frecuente de días?
yj 2,5 7,5 15
xi 0-5 5-10 10-20 ni.
24 18-30 16 12 0 28
37,5 30-45 28 6 4 38
56 45-67 16 13 5 34 Mediana: buscamos en las
n.j 60 31 9 100 frecuencias acumuladas el
n.jyj 150 232,5 135 517,5
valor 36 (N/2). El intervalo
mediano es (0, 5), por lo
n.jyj2 375 1743,8 2025 4143,8
que la mediana es 2,5 días
nj|X>30 44 19 9 72
njyj|X>30 110 142,5 135 387,5 El intervalo modal es el de
Nj|X>30 44 63 72 mayor densidad: (0, 5)
aj 5 5 10
dj 8,8 3,8 0,9
Ejercicio
c) ¿Son independientes estadísticamente las variables X e Y?
yj 2,5 7,5 15
xi 0-5 5-10 10-20 ni. Para comprobar que
24 18-30 16 12 0 28 son dependientes
37,5 30-45 28 6 4 38 basta con ver que para
56 45-67 16 13 5 34 alguna fila y columna
n.j 60 31 9 100 no se verifica fij = fi.f.j
NO
independientes
• •
estadísticamente
Ejercicio
d) Obtén la distribución del número de días de baja dada su edad.
¿De qué perfiles, fila o columna, se trata? A partir de estos
perfiles, ¿qué puedes decir de la independencia de estas
variables? Son los perfiles fila.
0-5 5-10 10-20 TOTAL Las distribuciones del número de
18-30 57.1% 42.9% 0.0% 100.0% días de baja son diferentes
30-45 73.7% 15.8% 10.5% 100.0% dependiendo de la edad del
45-67 47.1% 38.2% 14.7% 100.0% trabajador. Por lo tanto, las dos
Marginal Y 60.0% 31.0% 9.0% 100.0% variables no son estadísticamente
independientes.