Test Exacto de Fisher

El contraste de homogeneidad mediante la prueba Chi-Cuadrado entre dos variables cualitativas (o también llamado contraste de independencia entre dos variables cualitativas) se basa en la comparación de las frecuencias obtenidas con las frecuencias esperadas. La prueba exacta de Fisher está basada en la distribución exacta de los datos y no en aproximaciones asintóticas, y presupone que los marginales de la tabla de contingencia están fijos. En general, cuando las frecuencias absolutas esperadas, en la gran mayoría de casillas o celdas son relativamente grandes (más de 5), se utiliza el estadístico ChiCuadrado para realizar el contraste mencionado.

‡Cuando en un 20% de las casillas el valor esperado no es superior a 5, el estadístico anterior no es válido y generalmente se utiliza la prueba exacta de Fisher. ‡Habitualmente, la prueba exacta de Fisher es más conservadora que la prueba Chi-Cuadrado. ‡La prueba exacta de Fisher se aplica a variables dicotómicas

por ejemplo. c¶ = c1 ± a¶ y d¶ = f2 ± c¶. con la notación siguiente: A B + - + a c c1 b d c2 f1 f2 n A continuación. c¶. A partir de dichas tablas se calcula: f ! f !c ! c 1 2 1 Donde X! indica el factorial de X que se calcula como x·(x-1)·(x-2)·«·2·1. d¶.Test Exacto de Fisher Para calcular el estadístico de contraste. se construye en primer lugar la tabla de contingencia de dimensiones 2x2 con las frecuencias absolutas observadas. El p-valor unilateral-izquierda es = ! pa ' ! n!a '!b'!c'! d '! 2 §p a 'ea a' y el p-valor bilateral resultante es: el p-valor unilateral-derecha es = §p a 'ua §p a' pa ' e pa a' . b¶. 5!=5·4·3·2·1=120. b¶ = f1 ±a¶. f1}. siendo 0 < a¶ < mín{c1 . se construyen todas las tablas de contingencia 2x2 posibles con celdas a¶.

1720 42!1!4!19!18! 5 37 42 .Ejemplo: A partir de la tabla F1 F2 C1 4 1 C2 16 21 20 22 5 37 42 Calcular el valor p correspondiente al Test de Fisher: F1 F2 0 5 1º Calculamos la tabla para a=0 C1 C2 20 17 20 22 entonces p a0 ' 5!37!20!22! ! ! 0.0310 42!0!1!16!21! C1 C2 F1 1 19 20 F2 4 18 22 5 37 42 2ºº Calculamos la tabla para a=1 entonces 5!37!20!22! pa1 ' ! ! 0.

0182 ! 0.1253 ! 0.1745 5 0.1253 ! 0.3440  0.1253 Para a=5 pa5=0.0182 §p a 'ea a 'ua a' ! 0.1720  0.3440 3 0.3096  0.0310 ! 0.0182  0.0182 El valor p bilateral es El valor p unil-izq.3440 42!2!3!18!19! C1 C2 F1 3 17 20 F2 2 20 22 5 37 42 4º Calculamos la tabla para a=3 Entonces p a3 ' 5!37!20!22! ! ! 0.1435 §p a' .es: El valor p unil-der.1720 2 0.9818 ! 0.3º Calculamos la tabla para a=2 C1 C2 entonces F1 2 18 20 F2 3 19 22 p a2 ' 5!37!20!22! ! ! 0.0310  0.3096 42!3!2!17!20! 5 37 42 Para a=4 pa4=0.1253  0.1253  0.0310 1 0.3096 4 0.es: §p pa ' e pa a' Los valores de P para cada a¶ a¶ Pa¶ 0 0.

si es que las variables fueran independientes. Es un valor que se encuentra entre cero y uno . .donde la cercanía a cero indica independencia entre las variables. particularmente aprenderemos el coeficiente de contingencia.Coeficiente de contingencia Una forma de cuantificar el grado de asociación entre dos variables es calcular los coeficientes de asociación. Matemáticamente el coeficiente de contingencia se define por : C! m G2 G2  K Donde k es la cantidad de celdas de la tabla de contingencia y (oi  ei ) 2 G2 ! § ei i !1 m = el número de filas por columnas oi = frecuencia absoluta observada en la celda i. ei = frecuencia absoluta esperada en la celda i .

35 ! 0. según estos valores el coeficiente de contingencia es: C! ya que 3. es decir que fumar depende del sexo de los individuos.35 58 42 87 63 Este valor del coeficiente de contingencia refleja que existe cierto grado de asociación entre las variables.675 3. ( El porcentaje de fumadores en el grupo del mujeres es mayor ) .Ejemplo: En el caso de los fumadores en la tabla siguiente Mujeres Fumadores No Fumadores 65 (58) 35 (42) Hombres 80 (87) 70 (63) Los valores que aparecen sin paréntesis son las frecuencias absolutas observadas y los que aparecen con paréntesis son las frecuencias absolutas esperadas.35  4 (65  58 ) 2 (35  42 ) 2 (80  87 ) 2 (70  63 ) 2 G2 !    ! 3.

0.Prueba Test de Mc Nemar Prueba no paramétrica para dos variables dicotómicas relacionadas. Contrasta los cambios en las respuestas utilizando la distribución de chi-cuadrado.05 se considera significativo.) En una tabla de contingencia: A B + - + a c b d 2 G MN ! Matemáticamente el Estadístico de Mc Nemar se define por : ( b  c  1) 2 bc 2 Nota: Para el valor p. se utiliza la Tabla de G con 1 grado de libertad . Típicamente.1«. Es útil para detectar cambios en las respuestas debidas a la intervención experimental en los diseños del tipo "antes-después³ o para comparar dos tipos de tratamiento. un valor de significación menor que 0.01. pero podemos establecer un nivel de significación distinto (0.

83   p 0.Ejemplo 1 Se ejecutó la intervención educativa ³Salud bucal´ para modificar los conocimientos sobre higiene bucal en alumnos de tercer grado durante el primer semestre de 1998.001 . La tabla muestra los resultados obtenidos en conocimientos generales: Despues Inadecuado Adecuado Antes Inadecuado 14 102 Adecuado 0 7 G 2 MN ! ( b  c  1) 2 bc ! ( 102  0  1) 2 120  0 10201 ! ! 85 120 2 G MN ! 85 " 10.

2 3.Ejemplo 2 En la tabla se muestra el Grado de variación de las respuestas subjetivas de dolor en el raquis entre test previo y test posterior a una intervención en grupos experimentales de primaria y secundaria GRUPOS EXPERIMENTALES CONTRASTE DE ASOCIACIÓN DE RESPUESTAS TEST PREVIO No dolor Si dolor TOTALES TEST POSTERIOR No dolor Si dolor Totales 4 5 9 0 14 14 4 19 23 2 G MN ! ( b  c  1) 2 bc ! ( 0  5  1) 2 05 ! 16 ! 3.84   p " 0.2 5 2 G MN ! 3.05 .

08 12 2 G MN ! 4.84   p 0.05 .08 " 3.Ejemplo 2 En la tabla se muestra el Grado de variación de las respuestas subjetivas de dolor en el raquis entre test previo y test posterior a una intervención en grupos experimentales de Bachillerato GRUPOS EXPERIMENTALES CONTRASTE DE ASOCIACIÓN DE RESPUESTAS TEST PREVIO No dolor Si dolor TOTALES TEST POSTERIOR No dolor Si dolor Totales 13 10 23 2 9 11 15 19 34 G 2 MN ! ( b  c  1) 2 bc ! ( 2  10  1) 2 2  10 49 ! ! 4.

típicamente enfermar. este último especialmente si el evento es morir). curar. libre de enfermedad y susceptible de ella. aunque también morir. Se define el riesgo como la probabilidad de que un individuo. la desarrolle en un periodo determinado.(en la terminología anglosajona se usan los términos risk y hazard. Se usa el cociente entre el riesgo en el grupo con el factor y el riesgo en el grupo de referencia como índice de asociación y se denomina riesgo relativo (RR) o razón de proporciones. etc. condicionada a que el individuo no muera a causa de otra enfermedad durante el periodo.RIESGO Se denomina riesgo a la probabilidad de ocurrencia de un evento. .

En la tabla se representan esquemáticamente los resultados de un estudio que permita evaluar el RR. NR Casos a No casos c Total C0 Características ‡ no tiene dimensiones ‡ rango de 0 a ’ ‡ RR=1   no hay asociación entre la presencia del factor y el evento. en la columna NR figuran los eventos (³casos o enfermos´: a) y los ³no casos o controles´ (c) en la categoría que no tiene el factor de Riesgo y en la columna R los de la categoría que sí tiene el factor. es decir si la presencia del factor se asocia a mayor ocurrencia del evento ‡RR<1   la asociación es negativa. ‡RR >1   la asociación es positiva. R b d C1 f0 f1 A partir de la tabla b Ö Ö ! R1 ! c1 RR Ö a R0 c0 .

Ejemplo Placebo Casos No casos Total 420 2634 3054 Tratamiento 307 2744 3051 Ö! Ö c1 1 ! Ö a 0 c0 b Y a partir de la tabla: Ö! Ö c1 307 3051 0.101 1 ! ! ! ! 0.138 0 c0 b .73 Ö a 420 3054 0.

El odds ratio (OR) o razón de ventajas es el cociente entre el odds en el grupo con el factor y el odds en el grupo sin el factor.OR Existe otra manera. que en inglés se denomina odds y para el que no hay una traducción española comúnmente aceptada. indica cuanto más probable es la ocurrencia del evento que su no ocurrencia. Este cociente. proveniente del mundo del juego. . de representar la probabilidad de ocurrencia de un evento y es mediante el cociente entre la probabilidad de que ocurra el evento y la probabilidad de que no ocurra.

. ‡OR=1 si no hay asociación entre la presencia del factor y el evento ‡OR>1 si la asociación es positiva. es decir si la presencia del factor se asocia a mayor ocurrencia del evento y OR<1 si la asociación es negativa.NR Casos No casos Total a c C0 R b d C1 El OR se calcula Características b c1 Ö R1 d Ö Ö o d ds1 1  R1 bvc c1 Ö! OR ! ! ! Öds Ö a avd R0 od 0 Ö c0 1  R0 c c0 ‡ no tiene dimensiones ‡ rango de 0 a ’ .

Ejemplo Placebo Casos No casos Total 420 2634 3054 Tratamiento 307 2744 3051 El OR se calcula: Ö ! b v c ! 307 v 2634 ! 0.70 OR a v d 420 v 2744 .