Está en la página 1de 7

____________________

BIOESTADÍSTICA II

LECTURA 3
PRUEBA DE LA CHI-CUADRADO: BONDAD DE AJUSTE Y TABLAS DE CONTINGENCIA

Preparado por: Domingo Lancellotti

Objetivos:
1. Conocer la Prueba de Chi-cuadrado para la Bondad de Ajuste
2. Conocer la Prueba de Chi-cuadrado para Tablas de Contingencia
3. Aplicar correctamente ambos tipos de análisis a situaciones de Salud

PRESENTACIÓN
Uno de los procedimientos estadísticos más utilizados para el análisis de datos agrupados en unidades
discretas – Categorías –, es la Prueba de la Chi-cuadrado (2). Esta prueba contrasta las frecuencias que
son registradas en los grupos o Categorías de interés (frecuencias observadas), con las frecuencias que se
esperan para cada una de esas Categorías en base a un supuesto o el azar (frecuencias esperadas).

I. PRUEBA DE LA BONDAD DE AJUSTE


El propósito de esta prueba es establecer si la población conforma una distribución teórica específica. Por
ejemplo, en presencia de pacientes pertenecientes a distintos grupos de riesgo, se podría establecer si la
frecuencia de diagnóstico positivo para un cáncer en particular es la misma entre ellos (azar) o sigue una
determinada relación. Como ejemplo, el gráfico siguiente muestra que la probabilidad de un diagnóstico
positivo para cáncer de próstata en tres grupos distintos de riesgo aumenta progresivamente y podríamos
establecer si este aumento sigue la progresión (una razón) 1:2:4.

Pacientes con diagnóstico positivo para


Cáncer de Próstata
1
Probabilidad de Contraer

Frecuencia

0,8
Cáncer

0,6

0,4

0,2

0
G1
G1 G2
G2 G3
G3
Grupos de Riesgo
Grupos de Riesgo

La Prueba de la 2 para la Bondad de Ajuste corresponde a:

  i1
2  fobsi  fespi 2
k
(1)
fesp i

Donde, fobsi es la frecuencia observada en la categoría i, fespi es la frecuencia esperada en la categoría i, y k


es el número de categorías. Las fobsi son las frecuencias que el observador registra en un estudio o análisis
en particular, mientras que el valor de las fespi es calculado multiplicando el número total de observaciones, n,
por la proporción que la hipótesis nula predice para la respectiva categoría i.
El valor crítico de la prueba es 2, con k – 1 grados de libertad ( = número de grupos menos 1). La
distribución 2 es una distribución asimétrica y asintótica con respecto al eje x positivo (0 < 2 < +):

FACULTAD DE MEDICINA – DEPARTAMENTO DE SALUD PÚBLICA


____________________
BIOESTADÍSTICA II

Los valores críticos de la distribución 2 están tabulados (ver tabla a continuación y Manual del Estudiante),
encontrando en la primera columna los grados de libertad y en la primera fila los niveles de significancia:

TABLA DE VALORES CRÍTICO DE LA DISTRIBUCIÓN 2


 : 0,50 0,25 0,10 0,05 0,025 0,01

1 0,455 1,323 2,706 3,841 5,024 6,635


2 1,386 2,773 4,605 5,991 7,378 9,210
3 2,366 4,108 6,251 7,815 9,348 11,345
4 3,357 5,385 7,779 9,488 11,143 13,277
5 4,351 6,626 9,236 11,070 12,833 15,086
6 5,348 7,841 10,645 12,592 14,449 16,812
7 6,346 9,037 12,017 14,067 16,013 18,475
8 7,344 10,219 13,362 15,507 17,535 20,090
9 8,343 11,389 14,684 16,919 19,023 21,666
10 9,342 12,549 15,987 18,307 20,483 23,209
..
11 . 10,341 13,701 17,275 19,675 21,920 24,725
12 11,340 14,845 18,549 21,026 23,337 26,217
Ejemplo 1: 13Para las tres localizaciones
12,340 de ulceraciones
15,984 19,812 gástricas
22,362 que han sido definidas
24,736 27,688 – (i) úlcera
prepilórica, (ii) úlcera del cuerpo y (iii) úlcera cardial –, se quiere establecer si su frecuencia29,141
14 13,339 17,117 21,064 23,685 26,119 de ocurrencia es
la misma, esto 15 es, siguen 14,339
la razón 1:1:1 (por cada 22,307
18,245 1 úlcera prepilórica
24,996 hay 27,488
1 úlcera del 30,578
cuerpo y 1 úlcera
cardial).
Un estudio anatómico de ulceraciones gástricas en 300 pacientes arrojó el siguiente resultado en relación a la
ubicación de la úlcera (Pre = prepilórica; delC = del cuerpo; Car = cardial):
________________________________________________
Pre delC Car n
______________________________________
fobsi 160 100 40 300
________________________________________________

El protocolo de análisis es el siguiente:


i) H0: Las ulceraciones gástricas poseen la misma frecuencia de ocurrencia, esto es, 1:1:1 para las
úlceras Pre:delC:Car
HA: Las ulceraciones gástricas NO poseen una frecuencia de ocurrencia 1:1:1 para las úlceras
Pre:delC:Car
ii) Nivel de significancia,  = 0,05
iii) Valor crítico para :
2, = ( = 0,05 y  = k – 1 = 3 – 1 = 2)
20,05, 2 = 5,991
iv) Cálculo de la 2

FACULTAD DE MEDICINA – DEPARTAMENTO DE SALUD PÚBLICA


____________________
BIOESTADÍSTICA II

La prueba de 2 [fórmula (1)] requiere la obtención de las fespi, que de acuerdo a su definición se obtienen de
la siguiente manera:
a) Razón que la H0 predice para cada categoría i (1:1:1):
________________________________________________
Pre delC Car n
______________________________________
fobsi 160 100 40 300
fespi (1) (1) (1)
________________________________________________

b) Proporción que la H0 predice para cada categoría i (se obtiene sumando las razones, esto es, 1+1+1=3
y, luego, cada componente de la razón se divide por el total):
________________________________________________
Pre delC Car n
______________________________________
fobsi 160 100 40 300
fespi (1/3) (1/3) (1/3)
________________________________________________

c) Las fespi se obtienen multiplicando n por las respectivas proporciones (esto es, 300*1/3=100,
300*1/3=100 y 300*1/3=100):
________________________________________________
Pre delC Car n
______________________________________
fobsi 160 100 40 300
fespi 100 100 100 300
________________________________________________

La sumatoria de las fespi debe ser igual a n (y se debe expresar las fespi con decimales si fuera el caso).
iv) Cálculo de la 2

  i1
2  fobsi  fespi 2
k

fesp i
2 2 2
 160100   100100   40 100 
 2
 
100

 
100

 
100

 2  36,000  0,000  36,000


 2  72,000
Conclusión: Como 2calculado > 2crítico (2 = 72,000 > 20,05, 2 = 5,991) se rechaza H0. Entonces, la frecuencia
.

de ocurrencia de las ulceraciones gástricas no es la misma (NO sigue la razón 1:1:1).


Nota: Las frecuencias esperadas – fespi – pueden seguir cualquier relación teórica distinta al 1:1: … :1. Por
ejemplo, uno podría contrastar las combinaciones en que se dan ambos sexos en los hijos de familias con 2
hijos como 1:2:1 para mujer-mujer, mujer-hombre y hombre-hombre, respectivamente (según el cuadrado de
un binomio). O en el experimento de Gregorio Mendel sobre el color y rugosidad de piel de las arvejas como
9:3:3:1, etc.

FACULTAD DE MEDICINA – DEPARTAMENTO DE SALUD PÚBLICA


____________________
BIOESTADÍSTICA II

RESTRICCIONES:
La Prueba de la Chi-cuadrado es robusta y ampliamente utilizada en el ámbito de la Salud, sin embargo,
posee algunas restricciones que hay que tener en cuenta para que la prueba sea utilizada correctamente:
1. Si k = 2, la 2 requiere el siguiente factor de corrección, llamado corrección de continuidad de Yates:

 2

k  fobsi  fespi  0,52 (2)
i 1 fespi
La ecuación (2) señala que se debe obtener el valor absoluto de la diferencia y a ese valor restarle 0,5.
Luego, al resultado elevarlo al cuadrado y, finalmente, dividir por fespi.
2. La Prueba de la 2 es sensible a valores de fespi menores que 5. De este modo, se debe usar un n
suficientemente grande para asegurar frecuencias esperadas mayores que 5. Sin embargo, en
ocasiones es imposible aumentar el n (eventos y situaciones poco frecuentes) y en esos casos se debe
usar el Test Exacto de Fisher (buscar en la internet calculadoras para esa prueba).

Ejemplo 2: Se quiere establecer si los bebés varones y los bebés mujeres nacidos en el Hospital San Pablo
de Coquimbo siguen la razón 1:1. De un total de 2.308 bebés, el número de bebés por sexo fue de:
__________________________________________
Varones Mujeres n
________________________________
fobsi 1146 1162 2308
__________________________________________

El protocolo de análisis es el siguiente:


i) H0: El sexo de los niños al nacer sigue la razón 1:1
HA: El sexo de los niños al nacer NO sigue la razón 1:1
ii) Nivel de significancia,  = 0,05
iii) Valor crítico para :
2, = ( = 0,05 y  = k – 1 = 2 – 1 = 1)
20,05, 1 = 3,841
iv) Cálculo de la 2
Primero, se debe obtener las fespi de acuerdo a la definición:
a) Razón que la H0 predice para cada categoría i (1:1):
__________________________________________
Varones Mujeres n
________________________________
fobsi 1146 1162 2308
fespi (1) (1)
__________________________________________

b) Proporción que la H0 predice para cada categoría i (suma de las razones, 1+1=2 y, luego, cada
componente de la razón se divide por la suma):
__________________________________________
Varones Mujeres n
________________________________
fobsi 1146 1162 2308
fespi (1/2) (1/2)
__________________________________________

FACULTAD DE MEDICINA – DEPARTAMENTO DE SALUD PÚBLICA


____________________
BIOESTADÍSTICA II

c) Las fespi se obtienen multiplicando n por las respectivas proporciones (esto es, 2.308*1/2=1.154 y
2.308*1/2=1.154):
__________________________________________
Varones Mujeres n
________________________________
fobsi 1146 1162 2308
fespi 1154 1154 2308
__________________________________________

Nota: la sumatoria de las fespi debe ser igual a n.

iv) Cálculo de la 2 (dado que k = 2, utilizar fórmula (2)]

 2  i1
k  fobsi  fespi  0,52
fespi

 
2 1146 1154  0,5
2

1162 1154  0,5
2

1154 1154

 2  0,049  0,049
 2  0,098
Conclusión: Como 2calculado < 2crítico (2 = 0,098 < 20,05, 1 = 3,841) se acepta la H0. Entonces, el número
de bebés varones y de bebés mujeres nacidos en el Hospital San Pablo de Coquimbo, sigue la razón 1:1.

II. TABLAS DE CONTINGENCIA


Estas pruebas también son para datos agrupados en unidades discretas – Categorías –, sin embargo, las
Tablas de Contingencia son utilizadas cuando los datos son tomados simultáneamente para dos (ó más)
variables. El propósito es establecer si las frecuencias observadas en las Categorías de una variable son
independientes a las frecuencias observadas en las Categorías de la otra variable (es decir, que las
variables no están relacionadas).
La Prueba de la 2 para Tablas de Contingencia es:

 2 c

r f
obs  espij
ij
f 
2
(3)
i 1 j 1 fespij
La doble sumatoria indica que las respectivas frecuencias están ordenadas en filas (r) y en columnas (c)
(también, debe considerar el factor corrección de continuidad de Yates cuando k = 2).
Las frecuencias esperadas, fespij, son obtenidas mediante la siguiente fórmula:

fespij  Ri Cj  (4)


n
Aquí, Ri  número total de observaciones en la fila i, Cj  número total de observaciones en la columna j y n =
número total de datos. El valor crítico de la prueba corresponde a 2, donde  = (r –1)*(c –1), siendo r =
número de filas y c = número de columnas.

FACULTAD DE MEDICINA – DEPARTAMENTO DE SALUD PÚBLICA


____________________
BIOESTADÍSTICA II

Ejemplo 3: Se desea probar la hipótesis que la ubicación de la úlcera y el tipo de ulceración (Benigna o
Maligna) son independientes. Los datos se obtuvieron del mismo estudio del Ejemplo 1, pero reagrupados
según tipo de úlcera:
Ubicación
______________________________________
Pre delC Car Total
_________________________________________________
Benigna 100 70 30
Maligna 60 30 10
_________________________________________________

Protocolo de análisis:
i) H0: El tipo de úlcera es independiente de su ubicación (las variables no están relacionadas)
HA: El tipo de úlcera NO es independiente de su ubicación (las variables si están relacionadas)
ii) Nivel de significancia,  = 0,05
iii) Valor crítico para :
r = número de filas (Benigna y Maligna) = 2
c = número de columnas (Pre, delC y Car) = 3
2, = [ = 0,05 y  = (r – 1)*(c – 1) = (2 – 1)*(3 – 1) = 2]
20,05,2 = 5,991
iv) Cálculo de la 2
Las fespij se obtienen según la fórmula (4). Primero se deben obtener los totales marginales, que
corresponden a los totales de las respectivas filas (Ri) y de las respectivas columnas (Cj):

Ubicación
______________________________________
Pre delC Car Total
_________________________________________________
Benigna 100 70 30 200
Maligna 60 30 10 100
Total 160 100 40 300
_________________________________________________

La fesp para las úlceras Pre y Benigna (fobs = 100) se obtiene multiplicando el total de observaciones de la
respectiva fila (200) por el total de observaciones de la respectiva columna (160) , dividido por el total de datos
(300), esto es: (200*160)/300=106,7. Para las úlceras delC y Benigna (70), la fesp corresponde a
(200*100)/300=66,7 y así, sucesivamente, hasta llegar a las úlceras Car y Maligna (10) donde la fesp se
obtiene como (100*40)/300=13,3. Todas las fespij son entregadas en la siguiente tabla:

Ubicación
______________________________________
Pre delC Car Total
_________________________________________________
Benigna 106,7 66,7 26,7
Maligna 53,3 33,3 13,3
Total
_________________________________________________

FACULTAD DE MEDICINA – DEPARTAMENTO DE SALUD PÚBLICA


____________________
BIOESTADÍSTICA II

Nota: la sumatoria de las fespij de las filas y de las columnas deben ser iguales a los respectivos totales
marginales Ri y Cj.
iv) Cálculo de la 2 [utilizar fórmula (3)]

 2

100  106,7 
2

70  66,7 
2

30  26,7 
2

60  53,3
2

30  33,3
2

10  13,3
2

106,7 66,7 26,7 53,3 33,3 13,3

 2  0, 42070,16330, 4079 0,8422  0,3270  0,8188


 2  2,980
Conclusión: Como 2calculado < 2crítico (2 = 2,980 < 20,05,1 = 5,991) se acepta la H0 de independencia.
Entonces, no existe asociación entre el tipo de úlcera y su ubicación.

FACULTAD DE MEDICINA – DEPARTAMENTO DE SALUD PÚBLICA

También podría gustarte