Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tabulación Cruzada PDF
Tabulación Cruzada PDF
9/14/2006
Tabulación Cruzada
El procedimiento de Tabulación Cruzada esta diseñado para resumir dos columnas de datos.
Esta construye una tabla de dos-caminos mostrando las frecuencias de ocurrencia de cada uno de
los pares formados de las dos columnas. Estadísticas son construidas para cuantificar el grado de
asociación entre las columnas, y pruebas son corridas para determinar si hay dependencia
estadísticamente significante entre las columnas o no. Las frecuencias son mostradas en forma
tabular y graficadas como un grafico de barras, grafico mosaico o grafico tridimensional.
Una tabulación cruzada será realizada entre el tipo de vehículo y el número de pasajeros que
transporta.
• Variable Renglón: Columna numérica o no numérica que contiene el atributo usado para
definir los renglones de la tabla.
• Variable Columna: Columna numérica o no numérica que contiene el atributo usado para
definir las columnas de la tabla.
Número de Observaciones: 93
Número de filas: 6
Número de columnas: 6
Tabla de Frecuencias
La Tabla de Frecuencias muestra la frecuencia de ocurrencia de cada par de valores en las
variables filas y columnas, junto con otra información como se definió en la caja de dialogo
Opciones del Panel.
• Total de Columnas: El renglón de hasta abajo contiene el total de las columnas Cj:
r
C j = ∑ Oij (2)
i =1
r c
n = ∑∑ Oij (3)
i =1 j =1
Por ejemplo, 14 de los 93 carros fueron clasificados como Sporty. De estos, 2 son para 2
pasajeros mientras que el resto es para 4 pasajeros.
Oij
100 % (4)
n
Oij
100 % (5)
Ri
Oij
100 % (6)
Cj
• Frecuencia Esperada: Eij, el numero esperado de veces que el renglón i habría aparecido
junto con la columna j en le archivo de datos si las clasificaciones del renglón y la columna
fueron independientes:
Ri C j
Eij = (7)
n
(Oij − Eij )
2
(9)
Eij
(O − Eij )
ε ij =
ij
(10)
(1 − Ri ) (1 − C j )
Eij
n n
Los 12 carros Sporty en los datos del ejemplo de dos pasajeros representan:
Diagrama de Barras
Una manera común para mostrar los datos es usando un diagrama de barras múltiple.
15 Passengers
2
12 4
5
6
frecuencia
9
7
8
6
0
Compact Large Midsize Small Sporty Van
Type
La altura de cada barra en la grafica anterior representa el número de carros de cada tipo que
acarrean cada número de pasajeros.
• Tipo de Grafico: Las barras pueden estar conglomeradas como se muestra en el ejemplo o
apiladas una sobre otra.
• Escala: Si la escala del eje muestra las frecuencias Oij o el porcentaje dado por
Passengers
Compact 2
4
Large 5
6
Midsize 7
Type
8
Small
Sporty
Van
0 4 8 12 16 20 24
frecuencia
Grafico de Mosaico
Una interesante variación del diagrama de barras es si lo ancho y la altura de cada barra son
escalados para representar las frecuencias de las celdas correspondientes en la tabla.
Passengers
Compact 2
4
Large
5
6
Midsize
7
8
Small
Sporty
Van
En este grafico el tamaño de cada renglón es proporcional a su total de renglón Ri. el ancho de
cada barra dentro de cada renglón es proporcional a la frecuencia de cada celda dentro de ese
© 2005 por StatPoint, Inc. Tabulación Cruzada - 7
STATGRAPHICS – Rev. 9/14/2006
renglón. Esto resulta en barras cuyas áreas son proporcionales a la frecuencia en una celda
particular. En los datos del ejemplo, la barra mas grande corresponde a automóviles de Media
Talla que cargan 5 pasajeros
Diagrama Tridimensional
Todas las celdas de frecuencias pueden también ser representadas usando barras verticales.
15 8
12
frecuencia
9 7
6 6
3
0 5 Passengers
Compact
4
Large
Midsize
2
Small
Sporty
Van
Type
Prueba Chi-cuadrada
La prueba mas común para independencia es la prueba chi-cuadrada. Esta prueba compara las
frecuencias esperadas y observadas calculando:
r c (O − Eij )
2
χ = ∑∑
2 ij
(12)
i =1 j =1 Eij
Pruebas de Independencia
Prueba Estadístico Gl Valor-P
Chi-Cuadrada 197.595 25 0.0000
Advertencia: algunas celdas contienen menos de 5 casos.
Si el valor esperado Eij en cualquier celda es menor que 5, una advertencia será desplegada. En
tales casos, el cálculo de la estadística Chi-cuadrada puede no estar bien representada por una
distribución chi-cuadrada. Es particularmente serio si cualquier valor esperado es menor que 2.
Cuando esto ocurre, se debería reconsiderar combinar clases que no contienen muchos datos.
Como es el caso en el ejemplo actual con automóviles de 7 y 8 pasajeros.
Resumen Estadístico
Varias estadísticas pueden también ser calculadas midiendo los grados de asociación entre
renglones y columnas.
Resúmen Estadístico
Con Filas Con Columnas
Estadístico Simétrico Dependientes Dependientes
Lambda 0.4715 0.3803 0.5962
Coef. de Incertidumbre 0.5303 0.4730 0.6034
Somer's D -0.2022 -0.2193 -0.1876
Eta 0.0001 0.8810
Como un ejemplo, V de Cramer es una estadística que mide el grado de asociación entre los
valores de las variables renglón y columna en una escala de 0 a 1, es basada en la prueba
estadística usual chi-cuadrada. A diferencia de la estadística coeficiente de contingencia, esta
puede alcanzar el valor 1 para todas las tablas.
Detalles sobre estas pruebas están contenidos en la documentación del procedimiento Tablas de
Contingencia.
Razón de Momios
El panel Razón de Momios provee información especial sobre casos donde hay exactamente 2
renglones y 2 columnas. Para un ejemplo sobre esto, ver la documentación del procedimiento
Tablas de Contingencia
Grabar Resultados
Los siguientes resultados pueden ser guardados en una hoja de datos:
1. Celda de Frecuencias (una columna) – Las frecuencias de celdas Oij en una sola
columna, un renglón después de otro.