Documentos de Académico
Documentos de Profesional
Documentos de Cultura
variables categóricas
Introducción
En la parte dos, aprendimos como tabular
una distribución de frecuencias para una
variable categórica. Esta tabulación muestra
como los individuos están distribuidos en
cada categoría de una variable.
Por ejemplo, en una comunidad rural de
Ecatepec, a una muestra aleatorizada de 200
personas se les preguntó acerca de su índice
de nivel socioeconómico.
Introducción
En la tabla se muestra la distribución de individuos
en cada categoría del Índice de Nivel
Socioeconómico (INSE).
INSE n %
Bajo 50 25
Regular 110 55
Alto 40 20
Total 200 100
Introducción
Cuando queremos examinar la relación entre
dos variables categóricas, tabulamos una
contra la otra.
Esta es una tabla de dos vías o tabulación
cruzada.
Sur Centro Norte
Bajo 33 7 10
Regular 9 81 20
Alto 2 8 30
Total 44 96 60
Interpretación de una tabla de dos vías
Una asociación existe entre dos variables
categóricas, si la distribución de una variable,
varía de acuerdo al valor de la otra.
La pregunta en que estamos interesados es:
¿El nivel de INSE varía de acuerdo al sitio de
residencia?
Para responder esta pregunta necesitamos
valorar una tabulación cruzada.
Interpretando una tabla de dos vías
Para comparar las distribuciones en la tabla,
necesitamos examinar los porcentajes.
Para responder la pregunta, ¿qué debemos
examinar porcentajes de columna o de renglón?
Zona de residencia
INSE Sur Centro Norte
n % n % n %
Bajo 33 75 7 7.3 10 16.7
Zona de residencia
INSE Sur Centro Norte Total
n % n % n % n %
Bajo 33 75 7 7.3 10 16.7 50 25
Zona de residencia
INSE Sur Centro Norte Total
O E O E O E n
Bajo 33 11 7 24 10 15 50
Total 44 96 60 200
La prueba de Chi cuadrada
INSE Sitio de Observados Esperados O-E (O-E)2 (O-E)2/E
residencia
Bajo Sur 33 11 22 484 44
Bajo Centro 9 24 - 15 225 9.38
Bajo Norte 2 15 - 13 169 11.27
Regular Sur 7 24.2 -17.2 295.8 12.2
Regular Centro 81 52.8 28.2 795.2 15.1
Regular Norte 8 33 - 25 625 18.9
Alto Sur 10 8.8 1.2 1.44 0.2
Alto Centro 20 19.2 0.8 0.64 0.03
Alto Norte 30 12 18 324 27
Total 138.1
La prueba de Chi cuadrada en tablas 2 x 2
Claritromicina 91 9 100
Penicilina 82 18 100
Hipertensión 18 54 78 150
1 2 3
La prueba de Chi cuadrada para
tendencias
Realizamos una prueba de Chi cuadrada para
tendencias, cuando queremos evaluar si una
característica binaria varía linealmente a través de
los niveles de otra variable, esto es, evaluar si hay un
efecto dosis-respuesta.
La hipótesis nula para esta prueba es que la media
de los puntajes en los dos grupos (de la variable
binaria) son las mismas.
Así la prueba de Chi cuadrada se convierte en una
prueba de comparación de dos medias por esto tiene
sólo un grado de libertad.
La prueba de Chi cuadrada para
tendencias
_ _
(X (Si) – X (No))2
X2 = ------------------- =
S2 (1/n1 + 1/n2)
_
X (Si) = media del puntaje del grupo con hipertensión
_
X (No) = media del puntaje del grupo sin hipertensión
n1 total de personas en el grupo con hipertensión
n2 total de personas en el grupo sin hipertensión
s= desviación estándar para los puntajes de ambos
grupos
Validez de las pruebas de Chi cuadrada
Las pruebas de Chi cuadrada que hemos revisado están
basadas en la suposición de que la prueba estadística sigue
aproximadamente la distribución de X2.
Esto es razonable para muestras grandes pero para las
pequeñas deben ser usadas las siguientes guías:
Para tablas 2 x 2
Si el total del tamaño de muestra es > 40, entonces X2 puede
ser usada.
Si n está entre 20 y 40, y el valor esperado más pequeño es 5,
X2 puede ser usada.
De otra forma, se usa el valor exacto de Fisher.
Para tablas 2 x c
La prueba X2 es válida si no más del 20% de los valores
esperados es menos de 5, y ninguno es menos de 1.
Bibliografía
1.- Last JM. A dictionary of epidemiology.
New York, 4ª ed. Oxford University Press,
2001:173.
2.- Kirkwood BR. Essentials of medical
ststistics. Oxford, Blackwell Science, 1988: 1-
4.
3.- Altman DG. Practical statistics for medical
research. Boca Ratón, Chapman & Hall/
CRC; 1991: 1-9.