08 Guiones Bioestadistica CAP.8

×2
VIII. TEST CHI-CUADRADO Y TABLAS 2×

VIII.1. Introducción
• Objetivo: variables cualitativas/cuantitativas con datos presentados en forma de una

tabla de frecuencias con r filas y s columnas (tabla de contingencia r×s).
• Herramientas: estadístico/distribución chi-cuadrado ≡ ji−cuadrado ≡ χ2
• Problemas a estudiar:
(1) Test de Homogeneidad de varias muestras cualitativas (R.8.1.a):
Grupo Sanguíneo → A B AB O ni
España x x x x 100
Francia x x x x 150
Italia x x x x 120
¿Es la distribución del grupo sanguíneo igual en los tres países?
(2) Test de Independencia entre dos cualidades (R.8.1.b):
Color cabellos
Rubios Negros ……
Azul x x ……
Color Marrón x x ……
ojos Negro x x ……
Verde x x ……
500
¿Es independiente el color de los ojos del de los cabellos?
⇓
+ en el caso particular de tabla 2×2
(3) ¿Con qué fuerza se asocian dos características dicotómicas?: ¿Hasta qué punto
un factor de riesgo influye en la presencia de una enfermedad?
(4) ¿Cómo de bueno es un método de diagnóstico binario?: ¿cómo de buena es la
predicción de un test para detectar el cáncer de mama?
×2 (R.8.1.a)
VIII.2. Test de homogeneidad en tablas distintas a las 2×
VIII.2.1. Introducción e hipótesis a contrastar
Tabla 8.1
Generalización del problema de la comparación de dos proporciones al de la
homogeneidad de varias muestras.
→ En filas: los tratamientos.
→ En columnas: las respuestas.
→ En el interior: los porcentajes poblacionales de respuestas de cada tipo con cada
tratamiento.
→ Debajo de cada tabla: la hipótesis nula a contrastar (las afirmaciones entre paréntesis
son redundantes, pues se deducen de las que hay encima de ellas).
92 VIII.- TEST CHI-CUADRADO Y TABLAS 2×2
(a) Tabla 2×2: (b) Tabla 4×2:

2 tratamientos y 2 respuestas 4 tratamientos y 2 respuestas
SÍ NO Suma SÍ NO Suma
1 p1 q1 1 1 p1 q1 1
2 p2 q2 1 2 p2 q2 1
H0: p1 = p2 3 p3 q3 1
(q1 = q2) 4 p4 q4 1
H0: p1 = p2 = p3 = p4
(q1 = q2 = q3 = q4)
(c) Tabla 4×3:
4 tratamientos y 3 respuestas
Peor Igual Mejor Total

1 p1 p1′ p1′′ 1
2 p2 p2′ p2′′ 1
3 p3 p3′ p3′′ 1
4 p4 p4′ p4′′ 1
H 0 ≡ p1 = p2 = p3 = p4
p1′ = p2′ = p3′ = p4′
( p1′′ = p2′′ = p3′′ = p4′′ )
H 0: Los r tratamientos son iguales vs. H1: Al menos uno es distinto

H 0: La proporción de individuos que vs. H1: Alguna de las afirmaciones anteriores es falsa
caen en una determinada clase es la
misma con los r tratamientos, y esto
vale para todas las s clases
VIII.2.2. Ejemplo y notación: cantidades observadas
Tabla 8.2
Clasificación de r = 4 grupos de individuos según su estado (s = 3 respuestas) tras 4 tratamientos
Oij Peor Igual Mejor Totales
Tratamiento 1 7 = O11 28 = O12 115 = O13 150 = F1
Totales 37 = C1 118 = C2 405 = C3 560 = T
• Tabla 8.1 (c) → datos de la Tabla 8.2, en donde:
→ Los r = 4 totales de fila están fijados de antemano.
→ Cada total de fila se distribuye al azar en las s = 3 columnas.
→ Oij = Nº de individuos de la muestra i que caen en la clase j = Cantidades
Observadas.
→ Fi = Total de la fila i = nº de individuos de la muestra i = Σj Oij.
→ Cj = Total de la columna j = nº de individuos de la clase j = Σi Oij.
→ T = Gran total = nº total de individuos considerados = ΣFi = ΣCj =ΣΣOij.
BIOESTADÍSTICA – GRADO – MEDICINA, ENFERMERÍA 93
VIII.2.3. Cantidades esperadas (bajo H0)
• Hay que ver lo que sucedería si H0 fuera cierta ⇒ % “Peor” es el mismo con los 4
tratamientos + bis para “Igual” y “Mejor”.
• Si p1 = % “Peor” = 10% ⇒ de los 120 = F2 individuos del tratamiento 2, empeorarían
en promedio E21 = media de una binomial = tamaño muestra (F2) × probabilidad (p1):
E21 = F2×p1 =120×0,10 = 12
• Como p1 es desconocido, se la puede estimar (bajo H0) a partir de los datos
globales: p̂1 = 37 / 560 = C1 / T ⇒
37 120 × 37 F2C1
E21 = F2 × ˆp1 = 120 × = = = 7 ,93
560 560 T
• De modo general, las
Cantidades Esperadas = Eij =

FC
i j
=
( Total Fila ) × ( Total Columna ) (8.1)
T Gran Total
son las frecuencias de individuos que en promedio deberían caer en cada casilla ij si
fuera cierta H0 ⇒ datos de la Tabla 8.3:
Tabla 8.3: Cantidades esperadas para los datos de la Tabla 8.2
Eij Peor Igual Mejor Totales
Tratamiento 1 E11 = 9,91 E12 = 31,61 E13 = 108,48 F1 = 150
Totales C1 = 37 C2 = 118 C3 = 405 T = 560
→ ¡Los totales de Oij y Eij son los mismos!: sirve como regla de comprobación del
cálculo de las Eij.
→ Es conveniente juntar las dos tablas (Oij y Eij) en una ⇒ Tabla 8.4.
Tabla 8.4: Presentación conjunta de los datos de las Tablas 8.2 y 8.3
Oij
Peor Igual Mejor Totales
Eij
7 28 115
Tratamiento 1
9,91 31,61 108,48 150
15 20 85
Tratamiento 2
7,93 25,28 86,79 120
10 30 90
Tratamiento 3
8,59 27,39 94,02 130
5 40 115
Tratamiento 4
10,57 33,72 115,71 160
Totales 37 118 405 560
VIII.2.4. Condiciones de validez
• El estadístico χ exp
2
que sigue es discreto (pues las Oij en que se basa lo son) ⇒ hacen
falta unas cdv y una cpc.

• Las cdv clásicas (condiciones de validez del test chi-cuadrado) son:
Comentario 1: El test chi-cuadrado de Pearson en tablas diferentes a las 2×2 es válido si
ninguna Eij sea inferior a 1 y no más del 20% de ellas son menores o iguales que 5
(en nuestro ejemplo no hay problema: Eij > 5 siempre)

• Si las cdv no se verifican, pueden hacerse varias cosas:
→ Tomar muestras con Fi más grande (lo que aumentará las Eij).
→ Unir dos filas (tratamientos) en uno solo (sumando sus datos) ⇒ pero, ¡si la
significación está ahí, no se la detectará!
→ Unir dos columnas (clases) en una sola ⇒ pero, ¡si la significación está ahí, no se
la detectará!
→ Hacer un test exacto (no lo vemos).
VIII.2.5. Estadístico de contraste
• Si H0 fuera cierta ⇒ Oij ≈ Eij ⇒

→ Oij−Eij será pequeña.
→ (Oij−Eij)2 será pequeña: para evitar signos + y − (que se compensarían).
→ (Oij−Eij)2/ Eij será pequeña: para relativizar la discrepancia, pues
Oij = 99 vs. Eij = 100 da igual valor (Oij−Eij)2 = 1 que Oij = 0 vs. Eij = 1
→ ∑(Oij−Eij)2/ Eij será pequeña: para globalizar en todas las casillas.
• La medida de la discrepancia relativa global entre lo observado y lo esperado la da por
tanto el siguiente estadístico chi-cuadrado de Pearson:
(O − Eij )
2
Oij 2
χ exp =∑ =∑ − T (≥ 0 por definición)
2 ij
(8.2)
Eij Eij
en donde la segunda expresión es la más apropiada para el cálculo:

7 28 115
Tratamiento 1
9,91 31,61 108,48
15 20 85
Tratamiento 2
7,93 25,28 86,79
10 30 90
Tratamiento 3
8,59 27,39 94,02
5 40 115
Tratamiento 4
10,57 33,72 115,71
( 7 − 9,91) ( 28 − 31,61) (115 − 115,71)

2 2 2
72 282 1152
χ = 2
exp + + ... + = + + ... + − 560 = 13,87
9 ,91 31,61 115,71 9 ,91 31,61 115,71
• Corrección por continuidad: Se sabe que en tablas ≠ 2×2 no es preciso efectuar cpc.
De hacerla, el nuevo estadístico sería (cpc de 0,5 pues las Oij saltan de 1 en 1):
{O }
2
ij − Eij − 0 ,5
Estadístico chi-cuadrado de Yates = χY2 = ∑ (8.3)
Eij
VIII.2.6. Cantidad teórica y test
• Se ha dicho que ( χ exp

2
>> ⇒ H1 ) + ( χ exp
2
<< ⇒ H 0 ) : ¿qué es grande o pequeño? ⇒
Comparar del modo clásico la χ exp

2
con χα2 {gl = ( r − 1)( s − 1)} de Tabla 9
• χ exp
2
= 13,87 ≥ χ 52% {gl = 3 × 2 = 6} = 12 ,596 ⇒ H1 al error α = 5%.
χ α2
α 0,200 0,100 0,050 0,025 0,010 0,005 0,001

gl
5 7,291 9,237 11,073 12,838 15,087 16,762 20,750
6 8,559 10,646 12,596 14,459 16,810 18,549 22,676'
7 9,804 12,020 14,070 16,020 18,470 20,270 24,526
8 11,031 13,363 15,512 17,546 20,082 21,938 26,317
9 12,243 14,686 16,925 19,031 21,654 23,563 28,059
Nota: Para cada valor de los gl (primera columna) y de α (primera fila), en el
interior de la tabla se da el valor χα2 que deja a su derecha un área de α.
• 2,5% < P < 5% ⇒ H1 (P < 5%): hay evidencias significativas (P < 5%) de que no
todos los tratamientos son iguales.
VIII.2.7. Causas de la significación
• Si no todos los tratamientos son iguales: ¿cuáles son = y cuáles son ≠? ¿en qué clases?
Tabla 8.5
Búsqueda de las causas de la significación encontrada en la Tabla 8.2: porcentajes por filas
Clases
Peor Igual Mejor Total Por ejemplo:
Trat.
7
1 4,67 18,67 76,67 100% 4 , 67 = × 100
2 12,50 16,67 70,83 100% 150
3 7,69 23,08 69,23 100%
4 3,13 25,00 71,88 100%
• No se ve en detalle: hay que hacer una partición de tablas.
• De un modo aproximado e intuitivo puede deducirse algo observando los % por filas
(pues las Fi se fijaron de antemano) de la Tabla 8.5 ⇒ como si H0 fuera cierta, los %
de cada columna deberías ser aproximadamente iguales, los datos sugieren que:
T2 ≠ (T3=T4=T1), sobre todo en la columna “Peor”
×2 (R.8.1.b)
VIII.3. Test de independencia para cualidades en tablas ≠ 2×
Presentación de los datos

• Antes: r = 4 muestras clasificadas según 1 cualidad (en s = 3 clases).
• Ahora: 1 muestra clasificada según 2 cualidades A (r clases) y B (s clases) en una
Tabla de Contingencia r×s (el nombre se extiende al caso anterior) como la Tabla 8.6.
Tabla 8.6
Clasificación de 141 individuos con tumor cerebral según la localización y
naturaleza del mismo (Maxwell, 1961)
Naturaleza
Benigno Maligno Otros Totales
Localización
Lóbulo frontal O11 = 23 O12 = 9 O13 = 6 F1 = 38
Lóbulo temporal O21 = 21 O22 = 4 O23 = 3 F2 = 28
Otras áreas O31 = 34 O32 = 24 O33 = 17 F3 = 75
Totales C1 = 78 C2 = 37 C3 = 26 T = 141
• Origen de los datos: Tabla 8.7 (dos muestras apareadas de cualidades).

Tabla 8.7
Presentación original de los datos que dieron lugar a la Tabla 8.6
Individuo nº 1 2 3 4 … 141
Carácter A = Localización LF OA LF LT … OA
Carácter B = Naturaleza B O M B … B
Hipótesis a contrastar
• H0: Los caracteres A y B son independientes ≡ no asociados ≡ no relacionados.
• H1: Los caracteres A y B son dependientes ≡ sí asociados ≡ sí relacionados.
• En el ejemplo: H0: La “Naturaleza” del tumor es independiente de su “Localización”.
Antes vs. Ahora
• Las hipótesis son intercambiables, pues H0 es:
→ Ahora (Tabla 8.6): La Naturaleza es independiente de la Localización.
≡ % Benignos es = en todas las áreas, etc.
→ Antes (Tabla 8.2): % Peor es = en todos los tratamientos, etc.
≡ La Curación es independiente del Tratamiento.
Test y Conclusión
• El test se realiza como en la sección anterior:
Tabla 8.8 ⇒ χ exp
2
=7,86 (4 gl) ⇒ 5% < P < 10% ⇒ H0 (P > 5%).
⇒ la Naturaleza es independiente de la Localización (P > 5%), pero conviene

aumentar la muestra pues hay indicios de significación.
Tabla 8.8
Cantidades observadas (esquina superior izquierda) y esperadas (esquina inferior derecha) para los
datos de la Tabla 8.6
Naturaleza
T. Benigno T. Maligno Otros t. Total
Localización
23 9 6
Lóbulo frontal 21,02 9,97 7,01 38
Lóbulo temporal 21 4 3
28
15,49 7,35 5,16
Otras loc. 34 24 17
75
41,49 19,68 13,83
Total 78 37 26 141
Observaciones
• Clases cajón de sastre (“Otras áreas” con E23 = 5,16) para que se verifiquen las cdv.
• De dar H1 ⇒ calcular los % por filas (o por columnas) como en la Tabla 8.9.
Tabla 8.9
Porcentajes por filas para los datos de la Tabla 8.6
(% de tumores de cada tipo en cada zona cerebral)
Naturaleza
Benigno Maligno Otros Totales
Localización
Lóbulo frontal 60,5 23,7 15,8 100%
Lóbulo temporal 75,0 14,3 10,7 100%
Otras áreas 45,3 32,0 22,7 100%
×2 (R.8.2)
VIII.4. Tests en tablas 2×
• Surgen si en los dos casos de antes r = s = 2 ⇒ tabla 2×2.
• Se excluyen de las soluciones del caso general r×s anterior pues (como se ve abajo):
→ Ahora si es conveniente una cpc (≠ para cada problema).
→ Esto hace que varíen las cdv (≠ para cada problema).
• Además, el estadístico chi-cuadrado adopta ahora una forma más sencilla.
• En todo caso la cantidad teórica es χα2 (gl = 1) de la Tabla 9: gl = (2−1)×(2−1) = 1.
VIII.4.1. Tests clásicos para cualquier tabla 2×2: NO USAR (R.8.2.a)
Muchos textos y programas de ordenador dan las siguientes soluciones ERRÓNEAS

(se las cita solo por razones históricas)
Tabla 8.10: Los datos de la Tabla 7.6 (b) en el formato actual
(homogeneidad de dos proporciones independientes)
Mejoría
SÍ NO Totales
Muestras
Fármaco A O11 = 21 O12 = 69 F1 = 90
Fármaco B O21 = 32 O22 = 72 F2 = 104
Totales C1 = 53 C2 = 141 T = 194
Estadístico chi-cuadrado de Pearson (SIN cpc)

• La (8.2) (que no tiene cpc) se simplifica en:
(O O − O12O21 ) ( 21 × 72 − 69 × 32 )
2 2
χ = 11 22
2
T= × 194 = 1,344 ⇒ H0 (P > 20%)
90 × 104 × 53 × 141
P
F1 F2C1C2
• Sus cdv del Comentario 1 serán “todas Eij > 5” (pues hay sólo 4 casillas) ⇒ E = Mín
Eij > 5 con
( Mín Fi ) × ( Mín C j ) 90 × 53
E = mínima cantidad esperada = = = 26 ,4 > 5
T 194
• Test no fiable: es liberal (da más significaciones de las debidas) + cdv no correctas.
Estadístico chi-cuadrado de Yates (CON cpc)

• La (8.3) sí tiene cpc, pero es condicionada (se asume que los dos marginales están
fijados), se simplifica en:
2 2
 T  194 
 O11O22 − O12O21 −   21 × 72 − 69 × 32 − 
χY2 = 
2  2 
T= × 194 = 0,995
F1 F2C1C2 90 × 104 × 53 × 141
• Las cdv clásicas (E > 5) son incorrectas. Las correctas son:
Comentario 2
El test chi-cuadrado de Yates en cualquier tabla 2×2 es válido si
E ≥ 20,7 (aunque si T ≤ 500 basta con E ≥ 8,8)
• Aquí E = 24,6 > 8,8 (test válido) y H0 (P > 20%)

• Test no conveniente: es conservador (da menos significaciones de las debidas).
VIII.4.2. Test (óptimo) de homogeneidad en tablas 2×2: SÍ USAR (R.8.2.b)
Ejemplo
• Ejemplo 7.4 ⇒ Tabla 7.6(b) es adaptable al caso actual (r = s = 2) ⇒ Tabla 8.10 con:
H0: p1 = p2 (los % de éxitos son el mismo con ambos fármacos) vs. H1: p1 ≠ p2
Tabla 8.10: Los datos de Tabla 7.6 (b) en el formato actual
(homogeneidad de dos proporciones independientes)
Mejoría
SÍ NO Totales
Muestras
Fármaco A O11 = 21 O12 = 69 F1 = 90
Fármaco B O21 = 32 O22 = 72 F2 = 104
Totales C1 = 53 C2 = 141 T = 194
Tests incondicionado
Ahora la cpc es incondicionada (solo el marginal de filas está fijado)
Comentario 3
El test chi-cuadrado incondicionado de homogeneidad en tablas 2×2 (dos
muestras) es válido si E ≥ 14,9 (aunque cuando T ≤ 500 basta con que E ≥ 7,7).
(O O22 − O12O21 − c )
2
1 si F1 ≠ F2
χ 2
=
11
× T , con c= 
 2 si F1 = F2
exp
F1 F2C1C2
⇓
( 21 × 72 − 69 × 32 − 1)
2
χ 2
= × 194 = 1,340
90 × 104 × 53 × 141
exp
Válido: E = 24,6 ≥ 7,7

χ exp
2
=1,340 vs. χα2 {gl = 1} ⇒ H0 (P > 20%) ⇒ los dos fármacos son iguales.
• El test de una cola se hace como siempre.

¿Test de tipo χ2 o test de tipo z?
•
2
Antes: Cap. VII: Dos proporciones independientes: zexp = 1,1582 vs. z52% = 1,962
• Ahora: Cap. VIII: Homogeneidad en tablas 2×2: χ exp

2
= 1,340 vs. χ 52% = 3,842
↓ ↓
Iguales por Iguales por
fórmulas definición
χα2 (1 gl ) = zα2
• ¡Son el mismo test! ⇒ elegir el que se desee:
→ χ exp
2
es más cómodo, pero las tablas χα2 (1) son más cortas + el test no está
preparado para efectuar IC ni determinar tamaño de muestra.

→ zexp es más incómodo + no dificultades anteriores.
• Opción: zexp = χ exp

2
vs. zα de Tabla 1.
VIII.4.3. Test (óptimo) de independencia en tablas 2×2: SÍ USAR (R.8.2.c)
Ejemplo
Tabla 8.11: Los datos de la Tabla 7.7 (d) en el formato actual
(2 proporciones apareadas) o (independencia de 2 cualidades dicotómicas)
Centro de Salud
SÍ NO Totales
Ambulatorio
SÍ O11 = 27 O12 = 35 F1 = 62
NO O21 = 43 O22 = 20 F2 = 63
Totales C1 = 70 C2 = 55 T = 125
• Antes: H0: pA = pCS (dos proporciones de muestras apareadas),

≡ los % de síes a Ambulatorios y Centros de Salud son iguales.
zexp = 0,849 ⇒ H0 (se vio en capítulo anterior).

• Ahora: H0: Las opiniones sobre A y CS son independientes,
≡ un sí a uno no condiciona un sí al otro.
Se resuelve por χ2 con una cpc especial (ver más abajo).
• ¡Igual tabla ⇒ 2 preguntas ≠! ⇒ ¡análisis ≠!
Tests incondicionado
Ahora la cpc es incondicionada (ningún marginal está fijado)
Comentario 4
El test chi-cuadrado incondicionado de independencia en tablas 2×2 (una
muestra) es válido si E ≥ 6,2 (aunque cuando T ≤ 500 basta con que E ≥ 3,9).
(O O22 − O12O21 − 0 ,5 )
2
χ 2
exp =
11
×T
F1F2C1C2
⇓
Centro de Salud
SÍ NO Totales
Ambulatorio
SÍ O11 = 27 O12 = 35 F1 = 62
NO O21 = 43 O22 = 20 F2 = 63
Totales C1 = 70 C2 = 55 T = 125
( 27 × 20 − 35 × 43 − 0,5)
2
χ 2
= × 125 = 7 ,773 (1 gl )
62 × 63 × 70 × 55
exp
Válido: E = 24,6 ≥ 3,9

χ exp
2
=7,773 vs. χα2 {gl = 1} ⇒ H1 ( P < 1% ) ⇒
• Conclusión: Hay asociación entre las opiniones sobre ambos sistemas. El tipo de
asociación (+ ó −) se ve luego: ella aconsejará sobre la conveniencia de planificar el
test H0: pA = pCS con muestras independientes o apareadas.
• Observar: χ exp
2 2
=7,773 ≠ zexp = 0,8492 pues son dos tests ≠.
VIII.4.4. Preguntas y tests cuando hay dos muestras
Cuadro 8.1
Test a emplear cuando hay dos variables implicadas
Hipótesis Muestras independientes Muestras apareadas
a contrastar Homogeneidad Homogeneidad Independencia
2
2 cualidades dicotómicas Test z ≡ Test χ McNemar Test χ2
2 cantidades Student/Wilcoxon Student/Wilcoxon Correlación
Caso de 2 cualidades dicotómicas (ya visto)

• Muestras independientes: 1 pregunta + 2 tests equivalentes.
• Muestras apareadas: 2 preguntas + 2 tests distintos.
• Ejemplo de antes en apareadas: Tabla 7.6 (b)
Individuo nº 1 2 3 4 .... 125

Ambulatorio SÍ SÍ NO NO .... SÍ
Centro de S. SÍ NO SÍ NO .... NO
Caso de 2 cantidades (nuevo)

• Ocurre igual.
• Ejemplo:
Familia 1 2 …… 20
Estatura padre x x …… x ¡apareadas!
Estatura hijo x x …… x
→ H0: µP = µH: comparación 2 medias apareadas (capítulo anterior).
→ H0: Estatura Hijo es independiente de la del Padre (correlación de más adelante).
¡2 preguntas ≠ ⇒ 2 tests ≠!
VIII.5. Asignación de valores cuantitativos arbitrarios (R.8.3)

VIII.5.1. Introducción
• Los métodos basados en datos cuantitativos son preferibles a los basados en datos
cualitativos (como el método χ2), pues dan lugar a tests más potentes. Una prueba de
ello es el ejemplo de la Tabla 8.12 que se analiza a continuación.
• Objetivo: H0: El Cambio de Salud es independiente del Grado de Infiltración.
Tabla 8.12
(a) Clasificación de 196 leprosos de acuerdo con su cambio de salud
y el grado de infiltración en la piel
Cambios de salud (x)
Grado Mejoría Estacionario Peor Total
de infiltración Marcada Moderada Ligera
x=3 x=2 x=1 x=0 x = −1
Poca 11 27 42 53 11 144
Mucha 7 15 16 13 1 52
(b) % por filas
Marcada Moderada Ligera Estacionario Peor Total

Poca 7,6 18,8 29,2 36,8 7,6 100
Mucha 13,5 28,8 30,8 25,0 1,9 100
VIII.5.2. Solución clásica: por χ2
• Tabla 8.12 (a): Es una tabla de contingencia 2×5 ⇒ calcular esperadas, etc.
• χ exp
2
= 6,87 (4 gl) ⇒ 10% < P < 20% ⇒ H0 (P > 10%) (hay ligeros síntomas de H1).
• Tabla 8.12 (b): Sugiere que la mejoría con “mucha” es mejor que la de con “poca”.
VIII.5.3. Solución nueva (y mejor): por comparación de 2 medias
• Si una característica cualitativa es ordinal (como el Cambio de Salud), es posible y

preferible asignarle valores numéricos a sus clases -valores x de la Tabla 8.12 (a)- y
analizar los nuevos datos por la técnica apropiada.
• La variable x tendrá una media µM en “mucha” y otra µP en “poca” ⇒ H0 (de χ2) ≡ µM
= µP (dos muestras independientes).
• x es discreta, pero n1 = 144 y n2 = 52 son grandes ⇒ TCL ⇒ aplicar R.7.3.a.
• Datos de la Tabla 8.12 (a) ⇒ los tamaños, medias y varianzas de la Tabla 8.12 (c) ⇒
Tabla 8.12 (c)
Media y varianza de la variable x de la Tabla 8.12 (a)
(las Oij de allí son las frecuencias fi de aquí)
Poca Mucha
Σf = n 144 52
Σfx 1181 66
Σfx2 2601 140 1
x 0,8194 1,2692
s2 1,1420 1,1026
n1 + n2 144 + 52
x1 − x2 − 0,8194 − 1,2692 −
zexp =
2n1n2
= 2 × 144 × 52 = 2 ,559 ( 91,7 gl ) ⇒ H ( P < 2% )
1
s12 s22 1,1420 1,2692
+
+
n1 n2 144 52
• Hay evidencias significativas de que “mucha” es mejor que “poca” (pues

xM = 1, 2692 > xP = 0 ,8194 ) ⇒ el nuevo test detecta lo que en el anterior era sólo una
sugerencia ⇒ el nuevo test es más potente.
VIII.5.4. Comentarios finales
• Razones de la discrepancia: χ2 es un test global al que no importa el orden de las

casillas, pero a z sí le importa (la permuta de las columnas “Peor” y “Marcada” no le
afecta al test χ2, pero sí al test z).
• Estabilidad de las conclusiones:
→ x = 3, 2, 1, 0, −1 ≡ (x+1) = 4, 3, 2, 1, 0 ≡ 2x = 6, 4, 2, 0, −2 ⇒ zexp = 2,559 como antes.
→ x = 3, 2, 1, 0, −1 ≡ 3, 2, 1, 0, −2 (¿más lógico?) ⇒ H1 también.
• La asignación puede hacerse si el fenómeno estudiado hubiera podido medirse en una
escala continua de haber dispuesto de los instrumentos adecuados, y si las clases
obtenidas pueden considerarse como un agrupamiento de tal escala por medio de otra
más burda formada por sus valores redondeados.
• En el ejemplo se asume la existencia de un aparato ideal que mide el grado de mejoría
y que lo anotado es su redondeo al entero más cercano.
×2 (R.8.4)
VIII.6. Medidas de asociación en tablas 2×
VIII.6.1. Introducción, convenio y ejemplo
• Tablas 2×2: hasta ahora desde un punto de vista general; desde ahora desde un punto
de vista epidemiológico.
• Con frecuencia, los dos caracteres dicotómicos estudiados (E y FR) suelen aludir a:
→ La presencia o no de una enfermedad o efecto indeseado (E y E ) y a
→ La presencia o no de un factor de riesgo (FR y FR ).

• En lo que sigue se supone que:
→ La enfermedad se ubica en filas,
→ El factor de riesgo se ubica en columnas y
→ El SÍ en primer lugar,
obteniendo así unos datos como los de la Tabla 8.13.
• Ejemplo: Tabla 8.14 ⇒ evaluar la influencia de fumar en la época de la muerte.
Tabla 8.13
Formato estándar para los estudios epidemiológicos
Factor de Riesgo
SÍ ≡ FR NO ≡ FR Totales
Enfermedad
SÍ ≡ E O11 O12 F1
NO ≡ E O21 O22 F2
Totales C1 C2 T
Tabla 8.14
Asociación entre la época de la muerte (antes o después
de la edad media) y el hecho de fumar (sí o no)
Fuma SÍ NO
Muerte Totales
FR FR
Antes: E O11 = 60 O12 = 20 F1 = 80
Después: E O21 = 40 O22 = 30 F2 = 70
Totales C1 = 100 C2 = 50 T = 150
• Objetivo: tomada/s la/s muestra/s (ver próximo apartado):

→ ¿Son A y B independientes? ⇒ tests de la sección VIII.5.
→ ¿Con qué fuerza condiciona la presencia del factor de riesgo a la presencia de la
enfermedad? ⇒ medidas de los apartados VIII.6.4 y 5.
• Con frecuencia una o dos cantidades se dicotomizan para obtener una tabla 2×2. Así:
→ “Muerte antes” = “Edad al morir ≤ edad media”.

→ “Sí fuma” = “nº de cigarrillos/día ≤ 3”.
VIII.6.2. Tipos de Muestreo y Tipos de Estudio Epidemiológico (R.8.4.a)
• ¿Cómo se tomaron los datos de la Tabla 8.14?: ello afecta a cómo analizarlos.
• Para estudiar la asociación entre E y FR los tipos de muestreo pueden ser dos, lo que
da lugar a tres tipos de estudio (se subraya el nombre que se utilizará en adelante):
i) Muestreo de Tipo I (Estudio Transversal): Tomar T individuos al azar y
clasificarlos en base a E y FR (T = 150 muertos y clasificarlos).
ii) Muestreo de Tipo II (preferible al de Tipo I si las Fi o las Cj se planifican como
iguales):
→ Estudio Prospectivo, Longitudinal o de Seguimiento (“hacia adelante en el
tiempo”): Tomar C1 y C2 individuos al azar y clasificarlos en base a E (C1 =
100 “fumadores” y C2 = 50 “no fumadores” y clasificarlos).
→ Estudio Retrospectivo o de Caso-Control (“hacia atrás en el tiempo”): Tomar
F1 y F2 individuos al azar y clasificarlos en base a FR (F1 = 80 “antes” y F2 =
70 “después” y clasificarlos).
• Desde un punto de vista estadístico, el diseño óptimo consiste en tomar muestras de
igual tamaño de los niveles de la característica cuya probabilidad es más diferente del
50% (en general la enfermedad: estudio retrospectivo): se trata de que los marginales
sean lo más homogéneos posible.
VIII.6.3. Tests previos (R.8.4.b)
• Lo primero es contrastar H0: “E y FR son independientes” por los procedimientos

óptimos de VIII.4.2 y 3 lo que depende del tipo de estudio ⇒
Procedimiento de test
• Si E = Mín (F1 ; F2)×Mín (C1; C2) / T , comparar
(O O22 − O12 O21 − c )

2
χ × T con χα2 {gl = l} de Tabla 9, en donde:

2 11
exp =
F1 F2C1C2
→ c = 0,5 en los transversales + cdv del Comentario 4,
→ c = 1 (2) si C1≠C2 (C1=C2) en los prospectivos + cdv del Comentario 3
→ c = 1 (2) si F1≠F2 (F1=F2) en los retrospectivos + cdv del Comentario 3.
• En los tres casos, si:
→ c = T/2: chi-cuadrado con la cpc de Yates + cdv del Comentario 2.
→ c = 0: chi-cuadrado sin cpc.
Aplicación a la Tabla 8.14

Fuma SÍ NO
Muerte Totales
FR FR
Antes: E O11 = 60 O12 = 20 F1 = 80
Después: E O21 = 40 O22 = 30 F2 = 70
Totales C1 = 100 C2 = 50 T = 150
• E = 70×50/150 = 23,3.
5,352 en Transversal ( c = 0,5) y E = 23,3 > 3,9.

{ 60 × 30 − 20 × 40 − c}
2

• χ exp
2
= × 150 = 5,346 en Prospectivo ( c = 1) y E = 23,3 > 7 ,7.
80 × 70 × 100 × 50 
5,346 en Retrospectivo ( c = 1) y E = 23,3 > 7 ,7.
¡Todos significativos! ⇒ fumar condiciona la época de la muerte.
• ¿Con qué fuerza?: χ exp
2
y P miden las evidencias contra H0, no la fuerza de la
asociación ⇒ definir medidas de asociación en Tablas 2×2.

• Hay muchas: veremos las más importantes.
• La medida a utilizar:
→ Depende del objetivo,
→ Será lícita o no según el muestreo utilizado.
VIII.6.4. Diferencia de Berkson δ y Riesgo Relativo R (líneas 1 y 2 del Cuadro R.8.1)
Definición
• ¿Cómo de peligroso es fumar para morir antes?
Fuma SÍ NO
Muerte Totales
FR FR
Antes: E O11 = 60 O12 = 20 F1 = 80
Después: E O21 = 40 O22 = 30 F2 = 70
Totales C1 = 100 C2 = 50 T = 150
• Si Prospectivo (de igual modo si transversal):
 O11 60
 p1 = % "antes" en SÍ FUMA → ˆp1 = C = 100 = 60%
 1

 p2 = % "antes" en NO FUMA → ˆp2 = O12 = 20 = 40%
 C2 50
• ¿Cuánto de distintos son? ⇒ se mide por:
→ Capítulo anterior: δ = p1−p2 = Diferencia de Berkson (ya estudiada).

→ Capítulo actual: R=Riesgo Relativo=Razón de Riesgos (de fumar para morir antes):
p1 % enfermos en el grupo CON FR
R= =
p2 % enfermos en el grupo SIN FR
Estimación e Interpretación (fórmulas automáticas)

• Diferencia de Berkson:
O O − O12O21 60 × 30 − 20 × 40
→ δˆ = p
ˆ 1 − ˆp2 = 0,60 − 0,40 = 0,2 ⇒ δˆ = 11 22 = = 0 ,2 .
C1C2 100 × 50
→ En particular: “el % de muertes “antes” se incrementa en un 20% por el hecho de

fumar”.
→ En general: “la proporción de enfermos se incrementa en δ por el hecho de fumar”.
• Riesgo relativo:
p̂1 0 ,60 O C 60 × 50
→ R̂ = = = 1,5 ⇒ R̂ = 11 2 = = 1,5 ⇒
p̂2 0 ,40 O12C1 20 × 100
→ En particular: “el riesgo (o probabilidad) de morir antes es 1,5 veces mayor en los
fumadores que en los no fumadores”.
→ En general: “el riesgo de enfermar es R veces mayor en los individuos que poseen
el factor de riesgo que entre los que no lo poseen”.
→ Muy habitual en la literatura (incluso periódicos).
Validez
• δ̂ y R̂ SÍ son válidos en prospectivos y transversales: pues las pi se pueden estimar

(como arriba).
• δ̂ y R̂ NO son válidos en retrospectivos, pues la toma de muestras no fue la
adecuada: se puede estimar la proporción de “fumadores” entre los que mueren
“antes” (60/80, pues 80 = fijado), pero no la de muertes “antes” entre los “fumadores”
(pues 100 no es una muestra representativa del grupo de sí FR):
P{Fumar Antes} ≠ P{Antes Fumar}
Valores posibles
Si p1 = p2 Si p1 < p2 Si p1 > p2
R = 1,, δ = 0 R < 1,, δ < 0 R > 1,, δ > 0
Fumar: No influye Es bueno Es malo
Fumar: No es FR Es Factor de Protección Es Factor de Riesgo
Asociación: Nula Negativa Positiva
Mínimo R: p1 = 0 ⇒ R = 0; Máximo R: p2 = 0 ⇒ R = ∞
Mínimo δ: p1 = 0, p2 = 1 ⇒ δ = +1; Máximo δ: p1 = 1, p2 = 0 ⇒ δ = −1
⇓
Asociación→ − Nula +
R→ 0 1 ∞
• R = 1/5 ≡ R′ = 5 en fuerza (pero ≠ sentido) pues R = p1/p2 ≡ R′ = p2/p1.
• Si FR = “varón” da R < 1 ⇒ hacer FR = “mujer” para que R > 1 (que es de
interpretación más directa y sencilla) para tener un verdadero factor de riesgo.
(de modo similar para δ)
Inferencias
• R̂ ( δ̂ ) estima a R (δ): parámetros poblacionales desconocidos.

• Test: H0: R = 1 ≡ H0: δ = 0 ≡ H0: p1 = p2 ≡ H0: “E independiente de FR” ≡ Test χ2.
• IC (optativo para R; conocido para δ):
δ∈
O11 + h O21 + h
− ± zα
(O11 + h )(O21 + h ) + (O12 + h )(O22 + h ) con h = zα2 /4
C1 + 2h C2 + 2h ( C1 + 2h ) ( C2 + 2h )
3 3
 1 1 1 1  (O11 + 0,5)( C2 +1)

R ∈ Rˆ ′ × exp  ± zα + − −  con R̂′ =
 O11 + 0,5 O12 + 0,5 C1 + 1 C2 + 1  (O12 + 0,5)( C1 + 1)
VIII.6.5. Razón del Producto Cruzado (línea 3 del Cuadro R.8.1)
Es el parámetro más natural + el mejor + el menos intuitivo
Definición: si Prospectivo (de igual modo si es Transversal)
Fuma SÍ NO
Muerte Totales
FR FR
Antes: E O11 = 60 O12 = 20 F1 = 80
Después: E O21 = 40 O22 = 30 F2 = 70
Totales C1 = 100 C2 = 50 T = 150
• Grupo de SÍ FUMA:
Antes 60 3 O11
= = = : de cada 5 fumadores, 3 mueren “antes” y 2 “después”
Después 40 2 O21
• Grupo de NO FUMA:
Antes 20 2 O12
= = = : de cada 5 no fumadores, 2 mueren “antes” y 3 “después”
Después 30 3 O22
• Cada fracción es la odds ≡ Superioridad = Ventaja CON/SIN el FR (lenguaje de las
apuestas de la cultura inglesa).
• Dividiendo ambos:
O11O22 60 × 30 3 / 2
Ô = = = = 2 , 25
O12O21 20 × 40 2 / 3
Razón del Producto Cruzado = Odds-ratio = Razón de Superioridades = Razón de Ventajas
⇓
• En particular: la fracción de personas que mueren “antes” respecto de las que lo hacen
“después” es 2,25 veces mayor en los fumadores que en los no fumadores.

• En general: “la fracción de enfermos respecto de los sanos es O veces mayor en los
individuos que poseen el factor de riesgo que entre los que no lo poseen”.
• Si alguna Oij = 0 ⇒ Igual definición pero para (datos + 0,5):
Ô′ =
( O11 + 0,5 )( O22 + 0,5)
( O12 + 0,5)( O21 + 0,5)
Definición: si Retrospectivo
• Como Ô no cambia al permutar filas por columnas ⇒ O de E para FR = O de FR

para E (lo que no sucedía con R) ⇒ Ô es válido siempre.
Otros
• Valores posibles: como en R.
• Test: H0: O = 1 ≡ Test χ2 (O es el poblacional).
• ˆ ′ × exp  ± z
IC (optativo): O ∈ O
1
+
1
+
1
+
1 

α
 O11 + 0,5 O12 + 0,5 O21 + 0,5 O22 + 0,5 
VIII.6.6. Caso de las enfermedades raras (línea 2 del Cuadro R.8.1)
Generalidad
• Rara ≡ Pr (E) = prevalencia de la enfermedad < 10% (pequeña).
• Si P(E) < 0,1 ⇒ R ≈ O, Rˆ ≈ O
ˆ ⇒ Rˆ se puede estimar también en los retrospectivos
(en donde no era válido), pero a través de las fórmulas para O.

• Por ello los epidemiólogos no suelen distinguir entre R y O al interpretarlos (casi
todas las enfermedades son raras).
Ejemplo: si la Tabla 8.15 proviene de un retrospectivo, estimar R

Tabla 8.15
Clasificación de madres-hijos recién nacidos según su peso al nacer y su hábito de fumar
Peso Bajo Normal
Totales
Fumar E E
SÍ: FR 20 60 80
NO: FR 26 294 320
TOTALES 46 354 400
• R no puede estimarse en los retrospectivos, pero como la enfermedad es rara (% hijos

peso bajo es pequeño) ⇒
ˆ = 20 × 294 = 3,27
→ R̂ ≈ O
60 × 26
→ ¡No ha hecho falta permutar filas por columnas (para poner la enfermedad en filas)
pues Ô no cambia por ello! ⇒

→ La probabilidad de tener un hijo de peso bajo se multiplica por 3,27 por el hecho
de que la madre sea fumadora.
VIII.7. Evaluación de un método de diagnóstico binario (R.8.5)

VIII.7.1. Introducción y tipos de muestreo
• Para diagnosticar una enfermedad, el médico recurre a los síntomas y a la experiencia

(propia o ajena), pero cada día es más frecuente hacerlo a través de una única prueba
o test de diagnóstico (binario): ¿cómo de bueno es?
• Sean los sucesos:
E ≡ Estar enfermo ≡ “Padecer cáncer” en la Tabla 8.16.
E ≡ Estar sano ≡ “No padecer cáncer” en la Tabla 8.16.
D ≡ Diagnóstico + ≡ “El test predice que la mujer tiene cáncer” en la Tabla 8.16.
D ≡ Diagnóstico − ≡ “El test predice que la mujer está sana” en la Tabla 8.16.
Tabla 8.16
Resultados de un test diagnóstico cuando éste se aplica a un grupo de 1.000 mujeres con cáncer
y a otro de 1.500 mujeres sanas
Resultado del test

+(D) −(D) Totales
Presencia SÍ (E) O11 = 850 O12 = 150 F1 = 1.000

del Cáncer NO( E ) O21 = 45 O22 = 1.455 F2 = 1.500
Totales C1 = 895 C2 = 1.605 T = 2.500
• Muestreo de Tipo I: Tomar 2.500 mujeres al azar y clasificarlas.

• Muestreo de Tipo II: Tomar 1.000 enfermas y 1.500 sanas al azar y clasificarlas.
VIII.7.2. Evaluación de la calidad de un test: Sensibilidad y Especificidad (R.8.5.a)
Definición
• Hay 850 y 1.455 aciertos + 150 y 45 fallos en el diagnóstico ⇒ obtener los
porcentajes por filas para evaluar el método.
nº diagnósticos + entre los enfermos O11 850
• SN = = = = 85% = Sensibilidad
nº enfermos F1 1.000
≡ % de enfermos diagnosticados positivamente

≡ Capacidad del test para detectar a los enfermos pues:
SN >>> ⇒ el test es sensible a la enfermedad (pues la detecta ≡ da + si la hay).

O12 150
• FN = 1 − SN = = = 15% = Falsos Negativos
F1 1.000
≡ % de enfermos diagnosticados negativamente
SN + FN =1 ó 100%
nº diagnósticos − entre los sanos O22 1.455
• EP = = = = 97% = Especificidad
nº sanos F2 1.500
≡ % de sanos diagnosticados negativamente

≡ Capacidad del test para detectar a los sanos pues:
EP >>> ⇒ el test es específico de la enfermedad (pues da − si no la hay).

O21 45
• FP = 1 − EP = = = 3% = Falsos Positivos
F2 1.500
≡ % de sanos diagnosticados positivamente
EP + FP =1 ó 100%
Estimación (bajo cualquiera de los dos tipos de muestreo)

• Estimación puntual: Las indicadas arriba para SN, FN, EP y FP.
• Estimación por IC: hacerlo como en una proporción p (pues los cuatro parámetros son
simples proporciones). Por ejemplo, para la sensibilidad, la fórmula corta indica que
(n = 1.000, x = 850 > 20, n−x = 150 > 20 y p̂ = SN = 0,85):
 0 ,85 × 0 ,15 1 
SN ∈ 0,85 ± 1,96 +  ⇒ 82,7% ≤ SN ≤ 87,3%
 1.000 2.000 
Evaluación
• Deseable: los aciertos SN y EP sean ambos >>> → es raro que lo sean los dos.
• Si SN >>> (≡ FN <<<): Si el individuo tuviera la enfermedad ⇒ el test debería dar +
(pues SN >>>) ⇒ luego si da − es porque no la tiene ⇒
Si SN >>> ⇒ el test es útil para descartar la enfermedad
⇒ se le utilizará para el diagnóstico precoz de la enfermedad (para descartarla con
seguridad) ⇒ como test de cribado (“screening”).
• Si EP >>> (≡ FP <<<): Si el individuo estuviera sano ⇒ el test debería dar − (pues
EP >>>) ⇒ luego si da + es porque la tiene ⇒
Si EP >>> ⇒ el test es útil para afirmar la enfermedad
⇒ se le utilizará para afirmar la enfermedad en los individuos sospechosos de padecerla

(detectados por otros procedimientos).
• Regla nemotécnica:
→ SENEX: SENsibilidad alta sirve para EXcluir la enfermedad,
→ ESPIN: ESPecificidad alta sirve para INcluir la enfermedad.
• Para el ejemplo: el test es
→ SN = 85% ⇒ moderadamente útil para descartar la enfermedad.
→ EP = 97% ⇒ útil para afirmar la enfermedad.
¡Ojo!
• Un método que clasifique al azar (lanzando una moneda al aire) da SN+EP = 1 ⇒
SN + EP >> 1 para que el método sea útil en algo
¡un test que diagnostique + a todos ⇒ SN = 100, EP = 0!
¡un test que diagnostique − a todos ⇒ EP = 100, SN = 0!
• Por ello algunos autores utilizan el:
Índice de Youden = J = SN + EP − 1 ⇒ −1 ≤ J ≤ +1 (debe ser J >> 0)
• ¿Test χ2 de homogeneidad/independencia previo?: sin interés (se supone que el
método no clasifica al azar).
VIII.7.3. Evaluación de la utilidad clínica de un test: Valores Predictivos (R.8.5.b)
Introducción + Utilidad
• Al paciente le interesa conocer la fiabilidad de su diagnóstico ya ocurrido.
• Si me da +, ¿qué probabilidad tengo de estar realmente enfermo? :
VPP = % enfermos entre los diagnosticados positivamente = Valor Predictivo Positivo
(por ejemplo, el 95% de los diagnósticos + son correctos)
• Si me da −, ¿qué probabilidad tengo de estar realmente sano?:
VPN = % sanos entre los diagnosticados negativamente = Valor Predictivo Negativo
(por ejemplo, el 91% de los diagnósticos − son correctos) ⇒
VPP >>> ⇒ test útil para afirmar la enfermedad
VPN >>> ⇒ test útil para descartar la enfermedad
Estimación (solo para el muestreo de Tipo I: 2.500 mujeres al azar)

VPP y VPN son simples proporciones (mirar la tabla por columnas) ⇒
nº enfermos entre los + O11 850
VPP = = = = 94 ,97% ⇒ útil para afirmar la enfermedad.
nº + C1 895
nº sanos entre los − O22 1.455

VPN = = = = 90 ,65% ⇒ algo útil para descartarla.
nº − C2 1.605
Resultado del test

+(D) −(D) Totales
Presencia SÍ (E) O11 = 850 O12 = 150 F1 = 1.000

del Cáncer NO( E ) O21 = 45 O22 = 1.455 F2 = 1.500
Totales C1 = 895 C2 = 1.605 T = 2.500
¡Ojo!
• Si se clasifica al azar ⇒ VPP+VPN = 1 ⇒ debería ser VPP+VPN >>> 1 (como aquí).
VIII.7.4. Comentarios finales
• Dos criterios diferentes (no necesariamente concordantes) para evaluar un test:

→ El basado en la sensibilidad y especificidad.
→ El basado en los valores predictivos.
• Un test diagnóstico:
→ No es bueno o malo en general (puede ser bueno para afirmar o para descartar).
→ Tampoco es bueno o malo en abstracto (depende de la frecuencia de la enfermedad
–prevalencia- en la población a la que se le aplique) pues los valores predictivos
dependen fuertemente de la misma.
• De modo general:
→ SN y EP: sirven para evaluar de modo genérico la calidad de un test (en las
primeras fases de la evaluación del mismo), usualmente por el muestreo II.
→ VPP y VPN: sirven para evaluar la utilidad clínica de un test (cuando se le aplica a
una población específica), y debe hacerse a través de un muestreo de Tipo I.
Hacer ya la relación de Cuestiones + Problemas

08 Guiones Bioestadistica CAP.8

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

08 Guiones Bioestadistica CAP.8

Cargado por

Copyright:

Formatos disponibles

×2

VIII. TEST CHI-CUADRADO Y TABLAS 2×

• Objetivo: variables cualitativas/cuantitativas con datos presentados en forma de una

(a) Tabla 2×2: (b) Tabla 4×2:

Peor Igual Mejor Total

H 0: Los r tratamientos son iguales vs. H1: Al menos uno es distinto

VIII.2.2. Ejemplo y notación: cantidades observadas

VIII.2.3. Cantidades esperadas (bajo H0)

Cantidades Esperadas = Eij =

VIII.2.4. Condiciones de validez

falta unas cdv y una cpc.

(en nuestro ejemplo no hay problema: Eij > 5 siempre)

VIII.2.5. Estadístico de contraste

• Si H0 fuera cierta ⇒ Oij ≈ Eij ⇒

en donde la segunda expresión es la más apropiada para el cálculo:

( 7 − 9,91) ( 28 − 31,61) (115 − 115,71)

VIII.2.6. Cantidad teórica y test

• Se ha dicho que ( χ exp

Comparar del modo clásico la χ exp

α 0,200 0,100 0,050 0,025 0,010 0,005 0,001

VIII.2.7. Causas de la significación

Presentación de los datos

• Origen de los datos: Tabla 8.7 (dos muestras apareadas de cualidades).

⇒ la Naturaleza es independiente de la Localización (P > 5%), pero conviene

VIII.4.1. Tests clásicos para cualquier tabla 2×2: NO USAR (R.8.2.a)

Muchos textos y programas de ordenador dan las siguientes soluciones ERRÓNEAS

Estadístico chi-cuadrado de Pearson (SIN cpc)

Estadístico chi-cuadrado de Yates (CON cpc)

• Aquí E = 24,6 > 8,8 (test válido) y H0 (P > 20%)

VIII.4.2. Test (óptimo) de homogeneidad en tablas 2×2: SÍ USAR (R.8.2.b)

Válido: E = 24,6 ≥ 7,7

• El test de una cola se hace como siempre.

• Ahora: Cap. VIII: Homogeneidad en tablas 2×2: χ exp

preparado para efectuar IC ni determinar tamaño de muestra.

• Opción: zexp = χ exp

VIII.4.3. Test (óptimo) de independencia en tablas 2×2: SÍ USAR (R.8.2.c)

• Antes: H0: pA = pCS (dos proporciones de muestras apareadas),

zexp = 0,849 ⇒ H0 (se vio en capítulo anterior).

Válido: E = 24,6 ≥ 3,9

VIII.4.4. Preguntas y tests cuando hay dos muestras

Caso de 2 cualidades dicotómicas (ya visto)

Individuo nº 1 2 3 4 .... 125

Caso de 2 cantidades (nuevo)

VIII.5. Asignación de valores cuantitativos arbitrarios (R.8.3)

Marcada Moderada Ligera Estacionario Peor Total

VIII.5.2. Solución clásica: por χ2

VIII.5.3. Solución nueva (y mejor): por comparación de 2 medias

• Si una característica cualitativa es ordinal (como el Cambio de Salud), es posible y

• Hay evidencias significativas de que “mucha” es mejor que “poca” (pues

sugerencia ⇒ el nuevo test es más potente.

VIII.5.4. Comentarios finales

• Razones de la discrepancia: χ2 es un test global al que no importa el orden de las

→ La presencia o no de un factor de riesgo (FR y FR ).

• Objetivo: tomada/s la/s muestra/s (ver próximo apartado):

→ “Muerte antes” = “Edad al morir ≤ edad media”.

VIII.6.2. Tipos de Muestreo y Tipos de Estudio Epidemiológico (R.8.4.a)

VIII.6.3. Tests previos (R.8.4.b)

• Lo primero es contrastar H0: “E y FR son independientes” por los procedimientos

(O O22 − O12 O21 − c )

χ × T con χα2 {gl = l} de Tabla 9, en donde:

→ c = 0: chi-cuadrado sin cpc.

Aplicación a la Tabla 8.14

5,352 en Transversal ( c = 0,5) y E = 23,3 > 3,9.

asociación ⇒ definir medidas de asociación en Tablas 2×2.