Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lectura ACTIVIDAD 3, Prueba de La Chi-Cuadrado
Lectura ACTIVIDAD 3, Prueba de La Chi-Cuadrado
BIOESTADÍSTICA II
LECTURA 3
PRUEBA DE LA CHI-CUADRADO: BONDAD DE AJUSTE Y TABLAS DE CONTINGENCIA
Objetivos:
1. Conocer la Prueba de Chi-cuadrado para la Bondad de Ajuste
2. Conocer la Prueba de Chi-cuadrado para Tablas de Contingencia
3. Aplicar correctamente ambos tipos de análisis a situaciones de Salud
PRESENTACIÓN
Uno de los procedimientos estadísticos más utilizados para el análisis de datos agrupados en unidades
discretas – Categorías –, es la Prueba de la Chi-cuadrado (2). Esta prueba contrasta las frecuencias que
son registradas en los grupos o Categorías de interés (frecuencias observadas), con las frecuencias que se
esperan para cada una de esas Categorías en base a un supuesto o el azar (frecuencias esperadas).
Frecuencia
0,8
Cáncer
0,6
0,4
0,2
0
G1
G1 G2
G2 G3
G3
Grupos de Riesgo
Grupos de Riesgo
i1
2 fobsi fespi 2
k
(1)
fesp i
Los valores críticos de la distribución 2 están tabulados (ver tabla a continuación y Manual del Estudiante),
encontrando en la primera columna los grados de libertad y en la primera fila los niveles de significancia:
La prueba de 2 [fórmula (1)] requiere la obtención de las fespi, que de acuerdo a su definición se obtienen de
la siguiente manera:
a) Razón que la H0 predice para cada categoría i (1:1:1):
________________________________________________
Pre delC Car n
______________________________________
fobsi 160 100 40 300
fespi (1) (1) (1)
________________________________________________
b) Proporción que la H0 predice para cada categoría i (se obtiene sumando las razones, esto es, 1+1+1=3
y, luego, cada componente de la razón se divide por el total):
________________________________________________
Pre delC Car n
______________________________________
fobsi 160 100 40 300
fespi (1/3) (1/3) (1/3)
________________________________________________
c) Las fespi se obtienen multiplicando n por las respectivas proporciones (esto es, 300*1/3=100,
300*1/3=100 y 300*1/3=100):
________________________________________________
Pre delC Car n
______________________________________
fobsi 160 100 40 300
fespi 100 100 100 300
________________________________________________
La sumatoria de las fespi debe ser igual a n (y se debe expresar las fespi con decimales si fuera el caso).
iv) Cálculo de la 2
i1
2 fobsi fespi 2
k
fesp i
2 2 2
160100 100100 40 100
2
100
100
100
RESTRICCIONES:
La Prueba de la Chi-cuadrado es robusta y ampliamente utilizada en el ámbito de la Salud, sin embargo,
posee algunas restricciones que hay que tener en cuenta para que la prueba sea utilizada correctamente:
1. Si k = 2, la 2 requiere el siguiente factor de corrección, llamado corrección de continuidad de Yates:
2
k fobsi fespi 0,52 (2)
i 1 fespi
La ecuación (2) señala que se debe obtener el valor absoluto de la diferencia y a ese valor restarle 0,5.
Luego, al resultado elevarlo al cuadrado y, finalmente, dividir por fespi.
2. La Prueba de la 2 es sensible a valores de fespi menores que 5. De este modo, se debe usar un n
suficientemente grande para asegurar frecuencias esperadas mayores que 5. Sin embargo, en
ocasiones es imposible aumentar el n (eventos y situaciones poco frecuentes) y en esos casos se debe
usar el Test Exacto de Fisher (buscar en la internet calculadoras para esa prueba).
Ejemplo 2: Se quiere establecer si los bebés varones y los bebés mujeres nacidos en el Hospital San Pablo
de Coquimbo siguen la razón 1:1. De un total de 2.308 bebés, el número de bebés por sexo fue de:
__________________________________________
Varones Mujeres n
________________________________
fobsi 1146 1162 2308
__________________________________________
b) Proporción que la H0 predice para cada categoría i (suma de las razones, 1+1=2 y, luego, cada
componente de la razón se divide por la suma):
__________________________________________
Varones Mujeres n
________________________________
fobsi 1146 1162 2308
fespi (1/2) (1/2)
__________________________________________
c) Las fespi se obtienen multiplicando n por las respectivas proporciones (esto es, 2.308*1/2=1.154 y
2.308*1/2=1.154):
__________________________________________
Varones Mujeres n
________________________________
fobsi 1146 1162 2308
fespi 1154 1154 2308
__________________________________________
2 i1
k fobsi fespi 0,52
fespi
2 1146 1154 0,5
2
1162 1154 0,5
2
1154 1154
2 0,049 0,049
2 0,098
Conclusión: Como 2calculado < 2crítico (2 = 0,098 < 20,05, 1 = 3,841) se acepta la H0. Entonces, el número
de bebés varones y de bebés mujeres nacidos en el Hospital San Pablo de Coquimbo, sigue la razón 1:1.
2 c
r f
obs espij
ij
f
2
(3)
i 1 j 1 fespij
La doble sumatoria indica que las respectivas frecuencias están ordenadas en filas (r) y en columnas (c)
(también, debe considerar el factor corrección de continuidad de Yates cuando k = 2).
Las frecuencias esperadas, fespij, son obtenidas mediante la siguiente fórmula:
Ejemplo 3: Se desea probar la hipótesis que la ubicación de la úlcera y el tipo de ulceración (Benigna o
Maligna) son independientes. Los datos se obtuvieron del mismo estudio del Ejemplo 1, pero reagrupados
según tipo de úlcera:
Ubicación
______________________________________
Pre delC Car Total
_________________________________________________
Benigna 100 70 30
Maligna 60 30 10
_________________________________________________
Protocolo de análisis:
i) H0: El tipo de úlcera es independiente de su ubicación (las variables no están relacionadas)
HA: El tipo de úlcera NO es independiente de su ubicación (las variables si están relacionadas)
ii) Nivel de significancia, = 0,05
iii) Valor crítico para :
r = número de filas (Benigna y Maligna) = 2
c = número de columnas (Pre, delC y Car) = 3
2, = [ = 0,05 y = (r – 1)*(c – 1) = (2 – 1)*(3 – 1) = 2]
20,05,2 = 5,991
iv) Cálculo de la 2
Las fespij se obtienen según la fórmula (4). Primero se deben obtener los totales marginales, que
corresponden a los totales de las respectivas filas (Ri) y de las respectivas columnas (Cj):
Ubicación
______________________________________
Pre delC Car Total
_________________________________________________
Benigna 100 70 30 200
Maligna 60 30 10 100
Total 160 100 40 300
_________________________________________________
La fesp para las úlceras Pre y Benigna (fobs = 100) se obtiene multiplicando el total de observaciones de la
respectiva fila (200) por el total de observaciones de la respectiva columna (160) , dividido por el total de datos
(300), esto es: (200*160)/300=106,7. Para las úlceras delC y Benigna (70), la fesp corresponde a
(200*100)/300=66,7 y así, sucesivamente, hasta llegar a las úlceras Car y Maligna (10) donde la fesp se
obtiene como (100*40)/300=13,3. Todas las fespij son entregadas en la siguiente tabla:
Ubicación
______________________________________
Pre delC Car Total
_________________________________________________
Benigna 106,7 66,7 26,7
Maligna 53,3 33,3 13,3
Total
_________________________________________________
Nota: la sumatoria de las fespij de las filas y de las columnas deben ser iguales a los respectivos totales
marginales Ri y Cj.
iv) Cálculo de la 2 [utilizar fórmula (3)]
2
100 106,7
2
70 66,7
2
30 26,7
2
60 53,3
2
30 33,3
2
10 13,3
2