Está en la página 1de 5

M. En C.

Julio Ivan Alfonso Argüello

Tablas de contingencia parte 1


Cálculos manuales
Ejemplo 1. El propósito de un estudio realizado por Vermund et al., era investigar la
hipótesis de que las mujeres infectadas con VIH que también están infectadas con el virus
del papiloma humano (PVH) detectado mediante hibridación molecular, tienen más
probabilidad de tener anormalidades citológicas cervicales que las mujeres con uno de los
dos virus mencionados.
VIH
Seropositivo Seropositivo
PVH Seronegativo Total
sintomático asintomático
Positivo 23 4 10 37
Negativo 10 14 35 59
Total 33 18 45 96

Se pretende saber si es posible concluir que existe relación (dependencia) entre el estadio
de PVH y la etapa de infección por VIH con un nivel de 0.05 de significancia estadística.
Solucionando el problema
Las hipótesis estadísticas posibles son:
Ho: Hay independendencia entre el estadio de VIH y el PVH
Ho: No hay una asociación entre el estadio del VIH y el VPH

Ha: Hay una dependencia o asociación entre el estadio del VIH y el VPH

Se trata de un problema de una tabla 2 × 3 por lo que los grados de libertad del estadístico
de ji cuadrada es (r = 2 – 1) (c = 3 – 1) = 2 grados de libertad. Si consideramos el nivel de
significancia α = 0.05, tenemos que el valor critico χ2 0.05 (2) = 5.991. Donde r = renglones y
c = columnas para los grados de libertad.
El primer paso es el cálculo de las frecuencias esperadas que se estiman por el total de
columnas por el total de renglones entre el total de la muestra. En la tabla 1 se muestra los
datos del estudio numerados en orden transversal (en paréntesis) para el cálculo de las
frecuencias esperadas (Ei). Este orden es sugerido para evitar confusiones en la formula y
resultados.
M. En C.
Julio Ivan Alfonso Argüello

Tabla 1. Frecuencias observadas, y esperadas para los conteos del ejercicio 1. El orden
entre paréntesis tiene la finalidad de organizar las frecuencias esperadas.
VIH
Seropositivo Seropositivo
PVH Seronegativo Total
sintomático asintomático
Positivo 23 (1) 12.71875 4 (3) 6.9375 10 (5) 17.3438 37
Negativo 10 (2) 20.0727 14 (4) 11.0625 35 (6) 27.65625 59
Total 33 18 45 96

Para el primer caso o frecuencia esperada E1 tendremos (33) (37) / (96) = 12. 71875; para el
segundo caso o frecuencia esperada E2 es igual a (33) (59) / (96) = 20.28125; para la tercera
frecuencia esperada E3 = (18) (37) / (96) = 6.9375; E 4 = (18) (59) / (96) = 11.0625; E 5 =
(45) (37) / (96) = 17.3438; E6 = (45) (59) / (96) = 27.65625.

Aplicando la fórmula tenemos que:


2
χ 0 =¿ ¿

Como 20.606 > 5.991 se rechaza la hipótesis nula y se concluye que existe una dependencia
entre las variables. De otra forma el padecer virus del papiloma humano tiene una relación
con algún estadio del virus de inmunodeficiencia humana VIH.
En la figura 1 se aprecia la asociación entre las etapas de VIH y la presencia de PVH, en la
etapa de seropositivos sintomáticos se observa la mayor frecuencias de pacientes con PVH
positivo o presente. En los pacientes asintomáticos y negativos de VIH se aprecian las
menores frecuencias de casos de PVH negativos. La diferencia estadísticamente
significativa es clara en el grupo que ya presenta los síntomas de VIH con una presencia de
papiloma en contraste con los que son asintomáticos o están sanos. La relevancia es que las
dos variables están asociadas en cierta magnitud.
M. En C.
Julio Ivan Alfonso Argüello

40 PVH Positivo PVH Negativo


35
30
FRECUENCIAS 25
20
15
10
5
0

VIH (estadío)

Figura 1 Frecuencias (barras) agrupadas para la etapa de infección por VIH y el estatus
de virus de papiloma humano PVH.
En la figura 2 se muestran los resultados por computadora del programa SPSS, el paquete
proporciona el valor de chi cuadrado de Pearson que es el que se emplea con un valor de
20.606 el cual es el mismo que se obtuvo con los cálculos manuales empleando la formula.
Los grados de libertad son dos y el valor de P < 0.05 e incluso < 0.001; lo cual rechaza la
hipótesis nula de independencia. El valor de razón de verosimilitudes es un estadístico
ajustado llamado también G – test, el cual emplea un método de cálculo diferente al chi
cuadrado de Pearson el cual también resulta significativo (P < 0.05).

Figura 15.2 Resultados del análisis de tablas de contingencia con SPSS para el ejemplo 1.
M. En C.
Julio Ivan Alfonso Argüello

Ejemplo 2. En un estudio de la contaminación del aire, se obtuvieron dos muestras


aleatorias de 200 familias cada una a partir de dos comunidades. Se preguntó a cada una de
las familias si la contaminación del aire afectaba a alguno de sus miembros. Las respuestas
son las siguientes:
Comunidad Sí afecta No afecta Total
I 43 157 200
II 81 119 200
Total 124 276 400

¿Pueden concluir los investigadores que las dos comunidades difieren respecto a la variable
de interés? Sea α=0.05.
Solucionando el problema
En este ejercicio se trata de una tabla de contingencia de 2 x 2 para la cual se pide si existe
una relación o no entre las dos comunidades y si estas son afectadas por la contaminación.
La hipótesis estadística de independencia sería:
Ho: las comunidades no son afectadas por la contaminación (independencia de
variables)
Ha: las comunidades si se ven afectadas por la contaminación (dependencia de
variables)

Podríamos establecer que al menos una comunidad es afectada también y la hipótesis sería
similar al del análisis de varianza pero en general se redactan como en el caso anterior, con
la finalidad de responder a las preguntas de investigación.
Para cualquier tabla 2 × 2 siempre tendrán 1 grado de libertad, ya que (2 – 1) (2 – 1) = 1;
por tanto el valor critico de ji cuadrada o chi cuadrada es 3.84 al nivel 0.05 de significancia
estadística.
La forma de resolución se puede hacer con el método tradicional de las frecuencias
observadas y esperadas pero se puede emplear la formula resumida para tablas dos por dos
siguiendo la logística de asignarles letras a cada casilla y el orden debe ser tal cual se
muestra en la tabla:
Comunidad Sí No
I 43 (a) 157 (b) 200 (a + b)
II 81 (c) 119 (d) 200 (c + d)
124 (a + c) 276 (b + d) 400 (n)

La fórmula más común para tablas 2 x 2 es:


M. En C.
Julio Ivan Alfonso Argüello

2
χ 0 =n ¿ ¿
2
χ 0 =400 ¿ ¿

Como 16.877 > 3.84 se rechaza la hipótesis nula (resultando significativo) y se concluye
que hay una relación entre las comunidades y si esta se ve afectada por la contaminación.

También podría gustarte