Está en la página 1de 3

El Resumen Estadı́stico

Ficha 9: Tablas de Contingencia

1. Correlación entre dos variables cualitativas


El estudio de la correlación o asociación entre dos variables cualitativas se hace fundamentalmente por medio
de una Tabla de Contingencia o Tabla Cruzada. Ésta es un arreglo rectangular en el que en flas se ubican
las categorı́as de una de las dos variables y en columnas las categorı́as de la otra variable; en las márgenes de
la tabla se anotan los totales (de filas y de columnas) y en el interior del arreglo o tabla, las co-ocurrencias de
las distintas categorı́as.

Un ejemplo de tabla de contingencia o tabla cruzada es la siguiente, en donde se muestra el cruce de las
variables “Carrera” y “Procedencia” de un grupo de estudiantes universitarios:

Zona
Carrera Zona1 Zona2 Zona3 Totales
Carrera1 20 15 25 60
Carrera2 10 20 10 40
Carrera3 15 25 15 55
Carrera4 25 15 20 60
Totales 70 75 70 215

Tanto la lecturacomo la interpretación de esta tabla supone determinados “recorridos” para comprender su
contenido. Por ejemplo, una primera “mirada” será al tamaño de la tabla. Es decir, a la cantidad de unidades
de observación registradas en ella. En el ejemplo, ese valor es 215 estudiantes. Otra de estas miradas puede
consistir en examinar ambas márgenes. En cada margen se tiene información acerca del perfil de la variable
corespondiente. En la tabla del ejemplo, el perfil columna, por ejemplo, tiene una distribución bastante similar
para cada categorı́a de la varable Zona, no ası́ el perfil de la variable Carrera. Dichos perfiles pueden represen-
tarse gráficamente, ya sea pormedio de gráficos de barras o por medio de gráficos de sectores o circulares. Sin
embargo, no siempre son de interés ambos perfiles.

Finalmente, debe explorarse el interior de la tabla. Las representaciones gráficas más adecuadas a este
propósito son el gráfico de barras agupadas o bien el gráfico de barras apiladas.

A modo ilustrativo, la siguiente tabla registra información sobre el número de viviendas de una ciudad en
función de si poseen o no Aislación térmica y del Sector o ubicación geográfica de la misma.

Aislacion
Sector NO SI
Sector1 100 150
Sector2 140 80
Sector3 100 100

Las representaciones gráficas de las márgenes se muestra a continuación, en donde se evidencia la homoge-
neidad en la distribución de las mismas, según si tienen o no aislación térmica. De igual modo, el perfil de las

1
viviendas según el sector de ubicación, se muestra en el respectivo diagrama de barras, mismo que revela al
Sector 1 como el sector en donde hay más viviendas.

Notar que cualquiera o ambas representaciones anteriores pudieron hacerse mediante un gráfico de sectores.

Un gráfico de barras agrupadas asociado a esta tabla es el siguente:

Como puede observarse, las distribuciones marginales anteriores, y particularmente la distribución del Ais-
lamiento, ahora tiene muchas más psoibilidades de explicarse. Claramente el Sector 2 es un sector en el que
puede hacerse necesario un propgrama de aislamiento térmico, al mucho más importante o urgente, que en el
Sector 1.

2
2. Medida de la Asociación entre dos Variables Cualitativas
Ası́ como en el caso cuantitativo, en la situación cualitativa también es posible medir o cuantificar el grado
de asociación
s entre variables. Esto se hace con el coeficiente de contingencia de Pearson, que se define
χ2
como: C =
χ2 + n
P (fobs − fesp )2
donde χ2 = y fobs y fesp son, respectivamente, la frecuencia observada y la esperada, y n el
fesp 2
tamaño de la tabla.

El coeficiente de contingencia satisface 0 ≤ C < 1, y valores cercanos a 0 son indicativos de ausencia de


asociación, mientras que valores de C próximos a 1 son indicativos de una asociación importante.

Hay que señalar que el coeficiente de contingencia, y en particular el popular indicador χ2 , a diferencia del
coeficiente de correlación de Pearson, evidencia asociación tanto lineal como no lineal entre las variables.

Para la tabla que hemos venido analizando, el coeficiente Chi-cuadrado tiene un valor igual a 26,22, y
como el tamaño de la tabla es de 670, entonces el coeficiente de contingencia es igual a 0,19, valor que podrı́a
considerarse más bien cercano a 0 que a 1, y concluir entonces que no habrı́a una relación importante entre
el aislamiento térmico y el sector de ubicación de la vivienda. No obstante esta lectura, lo que corresponderı́a
realizar es una prueba de hipótesis de asociación antes de emitir un juicio sobre tal asociación.

Lecturas básicas y complementarias:

1. Correlación vs Causalidad

2. https://www.gaussianos.com/hay-que-decirlo-mas-correlacion-implica-causalidad/

3. https://es.xkcd.com/strips/correlacion/

—————————————
Ficha anterior: Correlacion Lineal
Ficha siguiente: Un ejemplo

También podría gustarte