Está en la página 1de 18

EST145 Estadı́stica

Estadı́stica Bivariada para Datos Categóricos

Pontificia Universidad Católica del Perú

EST145 Estadı́stica 1 / 18
Resumen

1 Estadı́stica Bivariada para Datos Categóricos


Tablas de Contingencia
Representación Gráfica

EST145 Estadı́stica 2 / 18
Estadı́stica Bivariada para Datos Categóricos Tablas de Contingencia

Tablas de contingencia y gráficos conjuntos

Es una distribución de frecuencias para dos variables cualitativas X e Y , las


cuales se observan a la vez sobre los mismos elementos de la población.

También llamadas tablas cruzadas o tablas de doble entrada.

EST145 Estadı́stica 3 / 18
Estadı́stica Bivariada para Datos Categóricos Tablas de Contingencia

Tablas de contingencia

Y
1 2 ··· j ··· b Total
1 n11 n12 ··· n1j ··· n1b n1+
2 n21 n22 ··· n2j ··· n2b n2+
.. .. .. .. .. .. .. ..
. . . . . . . .
X i ni1 ni2 ··· nij ··· nib ni+
.. .. .. .. .. .. .. ..
. . . . . . . .
a na1 na2 ··· naj ··· nab na+
Total n+1 n+2 ··· n+j ··· n+b n

nij = número de elementos (frecuencia absoluta) que tienen la categorı́a i de X y j de


Y.
ni+ = ni1 + ni2 + · · · + nij + · · · + nib (frecuencia absoluta marginal de la fila i).
n+j = n1j + n2j + · · · + nij + · · · + naj (frecuencia absoluta marginal de la columna j).

EST145 Estadı́stica 4 / 18
Estadı́stica Bivariada para Datos Categóricos Tablas de Contingencia

Tablas de contingencia

Ejemplo 1.1
Se midió el estado nutricional de 1000 niños de enseñanza básica, el que
fue clasificado como malo, regular y bueno. El rendimiento académico fue
clasificado como bajo, medio y alto.

Sujeto Nutrición Rendimiento


1 Mala Bajo
2 Buena Alto
3 Regular Alto
4 Regular Medio
5 Buena Bajo
.. .. ..
. . .
1000 Mala Alto

EST145 Estadı́stica 5 / 18
Estadı́stica Bivariada para Datos Categóricos Tablas de Contingencia

Tablas de contingencia

Ejemplo 1.1 (continuación)


Se puede organizar esta información a través de una tabla de contigencia

Rendimiento
Bajo Medio Alto Total
Mala 130 95 30 255
Nutrición Regular 90 450 35 575
Buena 63 30 77 170
Total 283 575 142 1000

EST145 Estadı́stica 6 / 18
Estadı́stica Bivariada para Datos Categóricos Tablas de Contingencia

Distribución de frecuencias

Y
1 2 ··· j ··· b Total
1 f11 f12 ··· f1j ··· f1b f1+
2 f21 f22 ··· f2j ··· f2b f2+
.. .. .. .. .. .. .. ..
. . . . . . . .
X i fi1 fi2 ··· fij ··· fib fi+
.. .. .. .. .. .. .. ..
. . . . . . . .
a fa1 fa2 ··· faj ··· fab fa+
Total f+1 f+2 ··· f+j ··· f+b 1
nij
fij = frecuencia relativa de la categorı́a i de X y j de Y .
n
ni+
fi+ = = fi1 + fi2 + · · · + fij + · · · + fib (frecuencia relativa marginal de la fila i).
n
n+j
f+j = = f1j + f2j + · · · + fij + · · · + faj (frecuencia relativa marginal de la
n
columna j).
EST145 Estadı́stica 7 / 18
Estadı́stica Bivariada para Datos Categóricos Tablas de Contingencia

Distribución de frecuencias

Ejemplo 1.1 (continuación)


Para los datos anteriores podemos encontrar la tabla de frecuencias

Rendimiento
Bajo Medio Alto Total
Mala 0.130 0.095 0.030 0.255
Nutrición Regular 0.090 0.450 0.035 0.575
Buena 0.063 0.030 0.077 0.170
Total 0.283 0.575 0.142 1000

EST145 Estadı́stica 8 / 18
Estadı́stica Bivariada para Datos Categóricos Tablas de Contingencia

Distribución de frecuencias marginal

Distribución Marginal de X
X
1 2 ··· j ··· a
f1+ f2+ ··· fj+ ··· fa+

Distribución Marginal de Y
Y
1 2 ··· j ··· b
f+1 f+2 ··· f+j ··· f+b

EST145 Estadı́stica 9 / 18
Estadı́stica Bivariada para Datos Categóricos Tablas de Contingencia

Distribución de frecuencias

Ejemplo 1.1 (continuación)


Para los datos anteriores,

Distribución marginal de la nutrición

Nutrición
Mala Regular Buena
0.255 0.575 0.170

Distribución marginal del rendimiento

Rendimiento
Bajo Medio Alto
0.283 0.575 0.142
EST145 Estadı́stica 10 / 18
Estadı́stica Bivariada para Datos Categóricos Tablas de Contingencia

Distribución de frecuencias condicional


Cada fila o columna se puede dividir entre su frecuencia marginal, con lo
que se obtienen las frecuencias condicionales.

Distribución Condicional de Y
Y
1 2 ··· j ··· b Total
f11 f12 f1j f1b
1 f1+ f1+ ··· f1+ ··· f1+ 1
f21 f22 f2j f2b
2 f2+ f2+ ··· f2+ ··· f2+ 1
.. .. .. .. .. .. .. ..
. . . . . . . .
fi1 fi2 fij fib
X i fi+ fi+ ··· fi+ ··· fi+ 1
.. .. .. .. .. .. .. ..
. . . . . . . .
fa1 fa2 faj fab
a fa+ fa+ ··· fa+ ··· fa+ 1

EST145 Estadı́stica 11 / 18
Estadı́stica Bivariada para Datos Categóricos Tablas de Contingencia

Distribución de frecuencias condicional

Distribución Condicional de X

Y
1 2 ··· j ··· b
f11 f12 f1j f1b
1 f+1 f+2 ··· f+j ··· f+b
f21 f22 f2j f2b
2 f+1 f+2 ··· f+j ··· f+b
.. .. .. .. .. .. ..
. . . . . . .
fi1 fi2 fij fib
X i f+1 f+2 ··· f+j ··· f+b
.. .. .. .. .. .. ..
. . . . . . .
fa1 fa2 faj fab
a f+1 f+2 ··· f+j ··· f+b
1 1 ··· 1 ··· 1

EST145 Estadı́stica 12 / 18
Estadı́stica Bivariada para Datos Categóricos Tablas de Contingencia

Distribución de frecuencias condicional

Diremos que no existe una relación entre las variables en estudio, o


también que estas variables son independientes, si la distribución de
frecuencias condicionales de una de las variables es más o menos la
misma para cada categorı́a de la otra variable.
La idea detrás del concepto de independencia recae en el hecho de que
si las variables son independientes no interesarı́a saber la categorı́a que
toma una de las variables para conocer la distribución relativa de los
valores que toma la otra variable.

EST145 Estadı́stica 13 / 18
Estadı́stica Bivariada para Datos Categóricos Tablas de Contingencia

Distribución de frecuencias condicional


Ejemplo 1.1 (continuación)
Hallamos las distribuciones del rendimiento condicional a la nutrición
Rendimiento
Bajo Medio Alto Total
Mala 0.5098 0.3725 0.1176 1.000
Nutrición Regular 0.1565 0.7826 0.0609 1.000
Buena 0.3706 0.1765 0.4529 1.000

Aquı́ por ejemplo el 6.09 % de los niños con una nutrición regular, obtienen
un alto rendimiento. Más de la mitad de los niños con una mala nutrición
(50.98 %) obtienen un bajo rendimiento; mientras que sólo un 11.765 % de
los niños con mala nutrición obtienen un alto rendimiento.
Se puede concluir que el rendimiento escolar no es independiente del estado
nutricional del niño. Las distribuciones de rendimiento para cada nivel de
nutrición son distintas.
EST145 Estadı́stica 14 / 18
Estadı́stica Bivariada para Datos Categóricos Representación Gráfica

Gráfico de barras componentes


Ejemplo 1.2

Distribución porcentual según nutrición y rendimiento

Rendimiento
0.5 Bajo
Medio
Alto
0.4
Frecuencia relativa

0.3
0.2
0.1
0.0

Mala Regular Buena

Nutrición

EST145 Estadı́stica 15 / 18
Estadı́stica Bivariada para Datos Categóricos Representación Gráfica

Gráfico de barras componentes al 100 %


Ejemplo 1.3

Distribución porcentual según nutrición y rendimiento


1.0

Rendimiento
Bajo
Medio
0.8

Alto
Frecuencia relativa

0.6
0.4
0.2
0.0

Mala Regular Buena

Nutrición

EST145 Estadı́stica 16 / 18
Estadı́stica Bivariada para Datos Categóricos Representación Gráfica

Gráfico de barras agrupadas


Ejemplo 1.4

Distribución porcentual según nutrición y rendimiento

Rendimiento
0.4 Bajo
Medio
Alto
0.3
Frecuencia relativa

0.2
0.1
0.0

Mala Regular Buena

Nutrición

EST145 Estadı́stica 17 / 18
Estadı́stica Bivariada para Datos Categóricos Representación Gráfica

Gráfico de barras agrupadas al 100 %


Ejemplo 1.5

Distribución porcentual según nutrición y rendimiento

Rendimiento
Bajo
Medio
Alto
0.6
Frecuencia relativa

0.4
0.2
0.0

Mala Regular Buena

Nutrición

EST145 Estadı́stica 18 / 18

También podría gustarte