Está en la página 1de 32

Todo lo que sigue (salvo las Prcticas de Ordenador) est extrado del libro:

Ttulo: BIOESTADSTICA para las Ciencias de la Salud (+).


Autores: Martn Andrs, A. y Luna del Castillo, J. D.
Editorial: Ediciones Norma-Capitel. Madrid.
1 Edicin: 2004 (672 pgs). ISBN: 978-84-8451-018-5 (84-8451-018-2). Depsito
Legal: M.37.286-2004.

Tema 1: Test exactos y asintticos en tablas 22

MATERIAL ALUDIDO EN EL TEXTO PRINCIPAL DE MS ABAJO


(DESDE LA SECCIN 8.8)

5.3.9 Mtodo general para obtener intervalos de confianza exactos con variables
discretas
El modo general de obtener un intervalo de confianza exacto de dos colas (1; 2)
para el parmetro de una v.a. discreta x que puede tomar los valores x = 0, 1, 2, ..., en
base a un valor observado x=K, consiste en calcular el ms pequeo (1) y el ms gran-
de (2) valor de que verifican, respectivamente, las ecuaciones:
P(x K) = /2, P(x K) = /2 (5.27)
lo que se conoce como el mtodo de Clooper-Pearson. Obviamente, cuando el intervalo
es de una cola en la expresin anterior hay que acoger solo uno de los valores (1 para
el intervalo 1; 2 para el intervalo 2) y cambiar /2 por . En realidad el prin-
cipio es similar para los intervalos asintticos y para las variables continuas.
Como se ve, el asunto es laborioso, pero en ocasiones se simplifica. Por ejemplo, si
x=0 en el caso de una P(), entonces la primera sumatoria es seguro la unidad, y el va-
lor 1 no existe o, ms correctamente, 1=0 (lo mnimo posible).
6.9 TESTS DE HIPTESIS E INTERVALOS DE CONFIANZA
An cuando el procedimiento de test y el procedimiento de intervalos persiguen fi-
nes distintos, existe una ntima relacin entre ambos. En la seccin 6.6 ya se puso de
manifiesto la utilidad de los intervalos de confianza para matizar las conclusiones de un
test de hiptesis. Pero ahora iremos ms all.
6.9.1 Test a travs de intervalos
Hasta ahora se ha descrito un procedimiento para realizar un test que est basado
en los intervalos de aceptacin: se plantean las hiptesis (H0 p=0,5 vs. H1 p>0,5), se
elige un error (5%), se elige un estadstico (el nmero x de caras), se obtiene bajo H0
un intervalo de aceptacin para l (x7) y, finalmente, se comprueba si el valor muestral
obtenido cae dentro del mismo (y se concluye H0) o no (y se concluye H1).
Alternativamente, tambin puede realizarse un test de hiptesis a partir de un inter-
valo de confianza. Para contrastar H0 p=0,5 vs. H1 p0,5 en base a que para n=10 se
obtuvieron x=9 caras, por la frmula del intervalo exacto para una proporcin -expre-
sin (5.18)- se obtiene que p (55,50%; 99,75%) al 95% de confianza. Como p=50%
(la hiptesis nula) no es uno de los valores posibles de p (segn el intervalo) debemos
concluir que H0 es falsa para un error del 5% (el del intervalo). Por el contrario, si el
resultado hubiera sido x=7 el intervalo sera p (34,75%; 93,33%) y, como p=50% es
2 BIOESTADSTICA

uno de tales valores, no podemos rechazar H0 y deber aceptrsela (al error =5%). Ob-
srvese que en este ltimo caso el intervalo obtenido no slo permite aceptar H0
p=50%, sino tambin H0 p=60% o H0 p=70% etc, y es claro que el verdadero valor
de p slo puede ser uno de ellos. Esto ilustra una vez ms, y quizs ms claramente aho-
ra, que las aceptaciones de H0 no son de fiar.
El nuevo procedimiento de realizar un test de hiptesis en base al intervalo de con-
fianza para el parmetro objeto de estudio, es una alternativa al procedimiento clsico
basado en el intervalo de aceptacin para el estadstico de contraste. Ambos mtodos no
son en general equivalentes, siendo preferible (por razones de potencia) el clsico. La
no equivalencia de los dos procedimientos puede ocasionar resultados aparentemente
incompatibles y de difcil interpretacin. Por ejemplo, si en el caso de la moneda se ob-
tiene significacin (p50%) al error del 5% y, al intentar matizar el resultado se obtiene
un intervalo de confianza para p (tambin al error del 5%) que contiene al 50%, el resul-
tado es paradjico, pero debe aceptarse. Lo que sucede es que el test se ha obtenido por
un procedimiento (ms potente) y el intervalo por otro. Para que ello no ocurra ambas
metodologas (la de los tests y la de los intervalos) deben ser compatibles, lo que nos
lleva al siguiente apartado.
6.9.2 Intervalo a travs de tests
A En el apartado 5.3.9 se habl del mtodo general para obtener un intervalo de con-
fianza para un parmetro. As, la expresin (5.27), adaptada al caso actual de una pro-
porcin p, indica que el intervalo de confianza de dos colas (p1; p2) para p viene dado
por aquellos valores p1<p2 tales que P(xrp1) = P(xrp2) = /2, con r el valor obser-
vado de x. Ntese que esas probabilidades son, respectivamente, el valor P para el resul-
tado experimental r en el test de H0 p=p1 vs. H1 p>p1 y en el test de H0 p=p2 vs. H1
p<p2, lo que lleva a concluir que se puede construir un intervalo de confianza median-
te la inversin de dos tests de hiptesis de una cola. Es por ello que podemos afirmar
que un intervalo de confianza de dos colas (p1; p2) al error para p se obtiene as:
p1 (p2) es tal que el valor P del test para H1 p>p1 (H1 p<p2) es /2 (6.5)
lo que es conocido como el mtodo TOST (Two One Sided Test). La ventaja del mtodo
TOST, al utilizarlo como medio para obtener un intervalo de confianza de una cola, es
que los resultados obtenidos por el test y los obtenidos por el intervalo son compatibles.
Para el caso de dos colas sucede igual solo si la variable tiene una distribucin simtrica
o si como criterio para el test de dos colas se utiliza el de doblar el P (ver apartado
6.7.2); en otro caso (que es lo ms frecuente) es mejor proceder como sigue.
B Agresti and Min (2001) probaron que el mtodo de (6.5) proporciona intervalos de
confianza de dos colas ms amplios (y por tanto peores) que el que sigue. El argumento
es invertir dos tests de dos colas (mtodo TTST: Two Two Sided Tests) ms que dos
tests de una cola, y as:
p1 y p2 son tales que el valor P del test para H1ppi es (6.6)
con lo que las conclusiones del test y del intervalo ya s son compatibles. El problema
para que no se haga as en esta obra, ni en la literatura general, es que las expresiones
anteriores requieren normalmente de un gran esfuerzo de cmputo. Por ello, circunstan-
cialmente, en este libro puede presentarse la incompatibilidad conceptual antes indicada.

7.5 LOS TESTS DE DOS COLAS CUANDO UNA VARIABLE DISCRE-


TA SE APROXIMA A TRAVS DE UNA CONTINUA

Anteriormente se han visto dos tests de dos colas basados en que la v.a.
original es discreta (Binomial o Poisson) y se aproxima a una v.a. continua (la
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 3

Normal). En todos los casos se ha calculado el valor P como el doble del valor P
del test de una cola (criterio de Armitage), lo cual es aparentemente apropiado
dado que la Normal es simtrica. El procedimiento ser apropiado cuando la
v.a. original sea simtrica respecto de su media (como en el Ejemplo 7.10 en el
que la Binomial con p=0,5 s es simtrica), pero no en otro caso. Desgraciada-
mente la literatura siempre lo hace as (quizs por la comodidad de los clcu-
los). El modo real de resolver el test se ilustra a continuacin con el caso de la
Poisson, pero el argumento es similar en todos los dems casos. El procedi-
miento (o criterio de Mantel) fue descrito por Mantel (1974) en el contexto de
las tablas 22, pero es de aplicacin general. Dado que el valor P por el criterio
de Armitage es siempre mayor o igual que el obtenido por el criterio de Mantel,
el primer test ser siempre conservador; de ah que si el mtodo clsico da signi-
ficativo, el que sigue tambin lo dar (y, por tanto, puede omitirse).
Consideremos el caso de tener que contrastar H0 =15,4 vs. H1 15,4
en base a una observacin x=23. Como 15,4>10, la aproximacin Normal es v-
lida. La solucin clsica de la (7.18) indica que zexp = (2315,40,5)/ 15, 4
= 1,81, por lo que P7% por la Tabla 2 o ms precisamente, P = 2 [1P(z
1,81)] = 7,02% por la Tabla 1. Veamos cmo obtener la solucin real:
1) Como x=23 > 0=0=15,4, la cola de error por la derecha ser P2 =
P(zzexp=1,81) = 1P(z1,81) = 3,51% por la Tabla 1;
2) Para obtener la cola de error por la izquierda es preciso determinar primero
el valor x de la otra cola que es tan distante o ms de 0 que x=23. Es
fcil ver que l ser x = [20x], con [t] aludiendo a que t debe redonde-
arse en el primer nmero entero lcito (en el sentido de alejarse de 0). Por
ello x = [215,4 23] = [7,8] = 7 (para as alejarse de 15,4). A dicho va-
lor (7) se le realizan los mismos clculos que antes: zexp= (715,40,5)/
15, 4 = 2,01 y P1 (el error de la cola izquierda) = P(z zexp=2,01) = 1
P(z2,01) = 2,22% por la Tabla 1;
3) Finalmente, y al igual que se procede con el mtodo exacto, P = P1+P2 =
3,51%+2,22% = 5,73%, valor menor o igual (siempre suceder as) que el
7,02% del mtodo clsico.

TEXTO PRINCIPAL (aunque se incorporan algunas cosas extras y bien


conocidas a fin de situarse en el contexto)

8.8 TEST DE COMPARACIN DE DOS PROPORCIONES CON MUES-


TRAS INDEPENDIENTES
Ejemplo 8.10: Se desea decidir cul de dos frmacos A y B es mejor reduciendo el dolor
de los pacientes con un cierto tipo de reuma. Con tal fin se tomaron dos
grupos equiparables de 6 y 13 pacientes respectivamente, administrndo-
les a cada uno el frmaco A o el B y anotando, tras un cierto tiempo, si
los pacientes haban mejorado o no. La Tabla 8.6(b) presenta los resulta-
dos obtenidos. Qu frmaco es mejor?
La proporcin de mejorados con el frmaco A (o el B) es un valor p1
(o p2) desconocido. El objetivo es contrastar H0 p1=p2 (la proporcin de
mejorados es la misma en los dos grupos y, por tanto, los dos frmacos
4 BIOESTADSTICA

son iguales) contra H1 p1p2 (los frmacos son diferentes, y ya se ver


en qu sentido). El test debe hacerse en base a las variables x1 = nmero
de mejorados de entre los 6 tratados con el frmaco A B(n1=6; p1) y
x2 B(n2=13; p2) lo propio con el frmaco B. Las proporciones muestra-
les son p 1 = 5/6 = 83,33% y p 2 = 4/13 = 30,77%, cabiendo preguntarse si
las mismas son distintas por azar o porque un frmaco es mejor que el
otro (H1). Como los dos grupos de individuos son distintos y sin relacin
entre s las muestras son independientes.

Los problemas de este tipo son los ms frecuentes en las Ciencias de la Sa-
lud; de ah que en esta seccin los veamos con bastante detalle. De un modo ge-
neral se trata de contrastar H0 p1=p2 contra H1 p1p2 en base a las dos v.a.
binomiales independientes x1 B(n1; p1) y x2B(n2; p2), de las que se ha toma-
do una observacin a la que tambin llamaremos por x1 y x2 respectivamente.
En general xi = nmero de individuos de entre los ni que presentan una carac-
terstica, siendo 100pi el porcentaje de individuos de la poblacin i que la pre-
sentan. A efectos prcticos conviene poner los datos en el formato de una Tabla
22 como la Tabla 8.6(a). Para realizar el test puede adoptarse una filosofa
condicionada o una incondicionada (recordar lo indicado en 8.7.1.1A), siendo
ahora x1+x2 el estadstico auxiliar sobre el que se condiciona (el que ha de man-
tenerse constante en toda la inferencia). Ahora le prestaremos atencin a ambas
filosofas pues los mtodos estn bien desarrollados y el problema es de especial
relevancia en casi todos los mbitos.
Tabla 8.6
(a) Presentacin general de los datos de una (b) Presentacin de los datos de la expe-
experiencia para comparar dos proporciones riencia del Ejemplo 8.10 en el formato de
independientes. la tabla (a).
Caracterstica Mejora
S NO Totales S NO Totales
Muestras Frmaco
I x1 y1 n1 A 5 1 6
II x2 y2 n2 B 4 9 13
Totales a1 a2 N Totales 9 10 19

De un modo general los valores ni aluden a los tamaos muestrales, los xi al


nmero de individuos de la muestra i que verifican la caracterstica en estudio,
los yi al de los que no la verifican, a1 al total de individuos con la caracterstica
en la dos muestras en conjunto, a2 al total sin ella y N al nmero total de indivi-
duos utilizados. A las cantidades ni y ai se les llama genricamente marginales
de la tabla (de filas para las ni o de columnas para las ai).

8.8.1 Mtodo condicionado clsico

8.8.1.1 Test exacto de Fisher


A La principal dificultad para la obtencin de un test exacto radica en el des-
conocimiento de la verdadera proporcin p1=p2 (=p) bajo H0 (llamada parme-
tro perturbador). Un modo de eliminarlo del problema es a travs del condicio-
namiento en el valor observado de a1 (estadstico auxiliar) con lo que todos los
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 5

totales de la Tabla 8.6 quedan fijos para el resto del problema. De hacerlo as, la
nica variable es x1 (por ejemplo), pues las dems pueden obtenerse restando x1
de los totales: x2 = a1x1, y1 = n1x1 e y2 = n2x2 = n2a1+x1. Cuando H0 es cierta
sucede que xiB(ni; p), de modo que P(x1a1) = P(x1)P(x2)/P(a1) por la defini-
cin de probabilidad condicionada. Como x1 y x2 son independientes, entonces
a1 = x1+x2 B(N=n1+n2; p) -por la (4.33)- de modo que sustituyendo arriba ca-
da probabilidad por su valor (4.29) puede verse que (x1a1) H(N; a1; n1) y as
sus probabilidades se obtienen como en la (4.48). Omitiendo el condicionante
(para mayor simplicidad de escritura) se ha visto que bajo Ho:
n1 n 2
x x n !n !a !a !
P(x1)= 1 2 = 1 2 1 2 , r=Mx (0; n1a2)x1s=Mn (a1; n1)(8.49)
N x1 !x 2 !y1 !y 2 !N!
a
1
expresin que, al no depender de parmetro desconocido alguno, permite calcu-
lar la probabilidad de la tabla. Una vez identificada la v.a. x1 que sirve de es-
tadstico de contraste, y su distribucin P(x1) bajo H0, el modo de proceder ser
el clsico de todo test de hiptesis (recordar el Captulo VI y, en particular, el
apartado 6.7.2): obtener la probabilidad de la muestra obtenida, o de una ms
extraa, y decidir en funcin del valor que se obtenga. Esto nos lleva a efectuar
los siguientes pasos.
Tabla 8.7
Valores posibles de x1, tablas 22 que los originan y probabilidades de las mismas para los
marginales de la Tabla 8.6(b).
x1 = 6 x1 = 5 x1 = 1 x1 = 0

6 0 6 5 1 6 1 5 6 0 6 6
3 10 13 4 9 13 8 5 13 9 4 13
9 10 19 9 10 19 9 10 19 9 10 19
P(6)=0,00309598 P(5)=0,04643963 P(1)=0,08359133 P(0)=0,00773994

1) Primero hay que determinar los valores posibles de la v.a. x1, es decir su es-
pacio muestral. Para los datos de la Tabla 8.6(b) la variable x1 puede tomar
los valores Mx (0; 610=4)=0 x1 Mn (9; 6)=6, es decir 0 x1 6. Ca-
da valor lcito de x1 proporciona una tabla 22 (cuyos valores se obtienen por
resta de los marginales): en la Tabla 8.7 se indican algunos valores de x1 y las
Tablas 22 que originan.
2) A continuacin hay que determinar la media de la v.a. Hipergeomtrica x1: 0
= n1a1/N = 69/19 = 2,84. Esto nos permite saber que el resultado observado
se encuentra a la derecha de la media -pues x1=5 > 0=2,84- de modo que si
el test es de una cola para la alternativa H1 p1<p2, como el resultado obser-
vado est en contradiccin con ello, entonces debe aceptarse H0 (su valor P
va a ser muy grande). Por el contrario, si la alternativa es H1 p1>p2, enton-
ces el valor P para ella ser P = P(x15) = P(5)+P(6).
3) Para obtener tales probabilidades hay que aplicar la (8.49):
6!13!9!10! 6!13!9!10!
P(6) = = 0,00309598 , P(5) = = 0,04643963
6!0!3!10!19! 5!1!4!9!19!
aunque en el proceso de clculo conviene eliminar el mximo nmero de
6 BIOESTADSTICA

trminos en cada ocasin; por ejemplo, en P(6) conviene eliminar los valores
6! y 10! del numerador y del denominador y simplificar el 13! del numerador
con el 19! del denominador, quedando en este ltimo como 1918 ... 14,
etc. En realidad cada probabilidad est relacionada con la anterior (por contar
con trminos en comn) y por ello interesa utilizar esta frmula recurrente:
x1 y2
P(x1 1) = P(x1 ) (descendente) (8.50)
(x 2 1)(y1 1)
Por ejemplo: P(5) = P(6)610/41, que da igual resultado que antes (por ra-
zones de precisin conviene mantener en los clculos un gran nmero de de-
cimales). Con ello P = P(5)+P(6) = 4,95% en el test de una cola para H1
p1>p2 y el problema finaliza: el test es significativo. Cuando el test es de dos
colas (como en nuestro ejemplo) el valor anterior es la probabilidad de una de
las colas (P1=4,95%) y hay que aplicar el cuarto paso que sigue.
4) Para determinar el valor P2 de la otra cola lo primero es saber donde comien-
za la misma, lo que implica calcular las probabilidades de los valores x1=0,
x1=1 etc. Con tal fin se procede como en el paso anterior, pero ahora la fr-
mula recurrente es la siguiente:
x 2 y1
P(x1 1) = P(x1 ) (ascendente) (8.51)
(x1 1)(y2 1)
En la misma Tabla 8.7 se indican las probabilidades de todos los x1 relevan-
tes al problema. Como P(0)P(5) y P(1)>P(5) entonces por la otra cola el va-
lor tan improbable o ms que el observado (el 5) es el 0. De ah que el valor P
de la otra cola sea P2 = P(x0) = P(x=0) = 0,77% y, finalmente, el valor P del
test de dos colas ser P = P1+P2 = 4,95%+0,77% = 5,72%: el test no llega a
ser significativo, pero hay indicios muy fuertes de que el frmaco A es mejor
que el B (pues p 1 =83,33% > p 2 =30,77%).
Cuando n1=n2 o a1=a2 la distribucin Hipergeomtrica es simtrica y el test
de dos colas anterior se simplifica: P = 2P1, es decir el valor P en el test de dos
colas es el doble del de una cola en la direccin apropiada (ver Ejemplo 8.11).
B Como se ha visto, el test exacto de Fisher es laborioso en sus clculos,
siendo especialmente conveniente disponer de unas tablas que los eviten. La
construccin de las mismas es dificultosa por cuanto la Hipergeomtrica depen-
de de tres parmetros (N, a1 y n1) y de una v.a. (x1), lo que hace que las tablas
sean demasiado extensas. La Tabla 16 es un ejemplo muy reducido de ellas; ta-
blas ms completas (y en el mismo formato) pueden encontrarse en la direccin
http://www.ugr.es/~bioest/crfisher.pdf. Dicha Tabla, como indica su nota a pi
de pgina, est construida de un modo muy especial tendente a ahorrar espacio.
La razn de ello es que como en la Hipergeomtrica no hay por qu distinguir
entre filas y columnas, las ocho tablas que se obtendran permutando las dos fi-
las de la Tabla 8.6, sus dos columnas o sus filas por columnas, slo es preciso
anotarlas una vez. Por tanto para resolver un problema lo primero es reordenar
la tabla experimental de modo que suceda que:
a1 = Mn {a1; a2; n1; n2} y p 1 = x1 / n1 < p 2 = x 2 / n 2
pero para ello no es preciso reordenar la tabla de modo estricto, sino que basta
con anotar en ella quines son los valores clave: x1, n1, a1 y N. Veamos el modo
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 7

de actuar (para todos los tests posibles) en base a los datos de la Tabla 8.6(b).
Si la alternativa es H1 p1<p2, la Tabla 8.6(b) no requiere ser reordenada
pues, siendo p 1 =83,33% > p 2 =30,77% contrario a H1, la conclusin es direc-
tamente H0. Si la alternativa fuera H1 p1>p2 tiene sentido realizar el test, por lo
que s es preciso reordenar la Tabla 8.6(b). Para ello se actuar as:
1) Al total se le llama N (N=19). En esto no hay duda;
2) Al marginal ms pequeo (de entre 6, 13, 9 y 10) se le llama a1 (a1=6).
3) De los dos nmeros que proporcionan a1 (5 y 1), uno ser x1 y el otro x2. De
los dos marginales opuestos al a1 (9 y 10), uno ser n1 y otro n2. Para decidir
quin es quin, hay que aplicar la segunda condicin de arriba: x1 es el que da
una proporcin ms pequea. Como 5/9 > 1/10, ser x1=1.
4) El valor n1 es el que sirvi de denominador a x1, de modo que n1=10.
Con todo ello los valores clave son N=19, a1=6, n1=10 y x1=1. Para ver la signi-
ficacin debe localizarse en la Tabla 16 la terna de nmeros (N=19; a1=6; x1=1),
por ese orden, en la columna de UNA COLA; ella proporciona los tres nmeros
C= 9, 10 y 12 correspondientes a los errores del 10%, 5% y 1% respectiva-
mente. Como C5%=10 n1=10 < C1%=12, el test es significativo para =5% y
no lo es para =1%, es decir 1%<P5% (lo que es compatible con el resultado
exacto de P=4,95%: aunque esto no suceder siempre pues la Tabla 16 est
construida por un mtodo ptimo distinto del descrito en el prrafo A).
Para el test de dos colas se procede como en el caso anterior, pero mirando
en la columna de DOS COLAS de la Tabla 16. Ahora C=10, 11 y 12 de modo
que 5%<P10% (lo que es compatible con el resultado exacto de P=5,72%). Pa-
ra ilustrar otros casos no vistos, supongamos que para la misma terna y caso an-
terior el valor de n1 fuera 9: como n1=9 < C10%=10, entonces P>10% y el test no
sera significativo. Finalmente, cuando en la Tabla 16 aparece C=-- ello indica
que para esos datos nunca se puede obtener significacin a los errores indica-
dos (con lo que P>10% seguro).
Ver al final la Prctica de Ordenador A
C Si el valor de P(x1a1) = P(x1)P(x2)/P(a1) del prrafo A no se obtiene bajo
H0, sino en los valores originales de p1 y p2, puede demostrarse que entonces la
distribucin condicionada es:
n1 n 2 x1

x x
P x1 s 1 2 (8.52)
n1 n 2 h

h r h a1 h

en donde r y s aluden a los lmites indicados en la expresin (8.49) y = p1q2/
p2q1, que es el parmetro natural del modelo condicionado, ser aludido en el
Captulo X como la razn del producto cruzado. Es posible (aunque numrica-
mente complicado) determinar el intervalo de confianza exacto para el parme-
tro , pero no para otros parmetros de inters como p1p2 pues el modelo con-
dicionado lo prohbe; no ocurre as con el mtodo incondicionado (como se ve
ms tarde).
Otro aspecto de la cuestin es la determinacin exacta del tamao de mues-
tra. Una vez ms el modelo condicionado lo impide (pues no hay modo de saber
8 BIOESTADSTICA

qu valores de ai van a suceder) y por ello los investigadores recurren al concep-


to de potencia media o potencia esperada para todos los ai posibles (que en rea-
lidad es una potencia incondicionada). Ver las tablas de Casagrande et al (1978).
Es por todas estas razones por lo que el intervalo de confianza y el tamao de
muestra se abordarn ms tarde desde la perspectiva incondicionada, aunque se les
compensar ponindoles una c.p.c. condicionada.
D Como sabemos, la v.a. Hipergeomtrica x1 anterior puede aproximarse a la
Normal si E = Min (n1; n2)Mn (a1; a2)/N > 5: ver la expresin (4.52). Cuando
esto es as, el test exacto de Fisher puede obtenerse de modo aproximado en ba-
se a la (7.9) con c.p.c. (pues x1 salta de 1 en 1) -zexp={x10,5}/- es decir
el test consiste en comparar:
n1a1 na
x1 0,5 x1 1 1 0,5
N N
zexp = con z de la Tabla 2 (8.53)
n1n 2 a1a 2 n1n 2 a1a 2
(N 1)N 2 N3
en donde la segunda expresin, que suele ser la ms utilizada, da lugar al test
que se indica en (8.56) (aunque este ltimo se obtiene por otro camino).

Ejemplo 8.11: Se investiga cul de dos pautas de administracin de un medicamento


produce menos efectos adversos. Si de los 40 enfermos a los que se les
administr la pauta I ninguno sufri efectos adversos y de los 40 a los
que se administr la pauta II 4 los sufrieron, hay evidencias de que una
pauta ejerce menos efectos adversos que la otra?
Aqu x1=0, n1=40, x2=4 y n2=40, siendo el objetivo contrastar H0 p1=
p2 por un test de dos colas (con pi las proporciones poblacionales de
efectos adversos con cada una de las pautas). El test exacto de Fisher, es
ahora especialmente simple de obtener pues n1=n2: P = 2P(x10) =
2P(x1=0) = 40393837/80797877 =11,56%.

8.8.1.3 Caso en que es vlida la aproximacin a la Normal

A En el prrafo D de 8.8.1.1 ya se indic cmo obtener el test asinttico para


el problema actual; ahora se le va a deducir de nuevo, aunque desde una pers-
pectiva incondicionada (que es ms til para nuestro fin). De ser vlida la
aproximacin a la Normal de las variables xi, ya sabemos que p i =xi/niN(pi;
p i q i / ni ) y, como las dos muestras son independientes, entonces:
p1q1 p2 q 2
p 1 p 2 N p1 p2 ; (8.54)
n1 n2
Esto implica que, bajo H0, p 1 p 2 N{0; pq(1/ n1 1/ n 2 ) }, con p1=p2=p la
proporcin comn y q=1p como siempre. Por ello la cantidad experimental del
test ser zexp = p 1 p 2 / pq(1/ n1 1/ n 2 ) por paralelismo con la (7.9). Como
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 9

p es desconocido, no queda ms remedio que sustituirlo por una estimacin. A


tal efecto hay dos estimaciones posibles, p 1 y p 2 , por lo que la mejor estima-
cin de p ser el promedio ponderado de ambas, es decir:
n1p 1 n 2 p 2 x x2 a
p = = 1 = 1 (8.55)
n1 n 2 n1 n 2 N
cantidad que en el Ejemplo 8.10 es 9/19=47,37% y alude a la proporcin de me-
joras en las dos muestras como si fueran una sola (lo que es lgico, pues bajo
H0 las dos poblaciones son la misma). Como es habitual, q =1 p : la proporcin
comn de no mejoras es del 52,63%. Sustituyendo p =a1/N y q =a2/N en la zexp
anterior y realizando la c.p.c. condicionada clsica de (1/n1+1/n2)/2, el test con-
sistir en comparar:
1 1 1 N
p 1 p 2 p 1 p 2
2 n1 n 2 2n1n 2
zexp = = con una z de Tabla 2 (8.56)
1 1 N

pq
pq
n1 n 2 n1n 2

Realizando operaciones puede verse que la zexp anterior da igual valor que la se-
gunda expresin de (8.53); de hecho, el mismo razonamiento anterior puede lle-
var a una zexp igual a la de la primera expresin de (8.53) si en lugar de sustituir
p por su estimador insesgado p , se sustituye pq por su estimador insesgado pq .
El test anterior es doblemente aproximado (pues l usa la aproximacin de la
Binomial a la Normal y sustituye p por una estimacin) y, sin embargo, en la
prctica se comporta bastante bien.
Para test de una cola a la derecha (H1 p1>p2) la comprobacin previa a
realizar es que p 1 p 2 . Para el test de dos colas es ms potente aplicar el crite-
rio de Mantel de la seccin 7.5, en donde la variable es x1 y la media es 0 =
a1n1/N como se vio en el test exacto de Fisher (al cual intenta aproximar el ac-
tual). En todo caso la (8.56) ha de entenderse en el sentido de la (7.12).
En cuanto a las condiciones de validez del test lo tradicional es admitir las
clsicas enunciadas hasta ahora: el test ser vlido si las cantidades n1 p , n2 p ,
n1 p y n2 p son mayores que 5 (para que las Binomiales se aproximen a la Nor-
mal). Esto es equivalente a comprobar la siguiente nica condicin -que resume
a las cuatro anteriores por tomar la ms desfavorable de ellas- y que es la misma
que se enunci para la (8.53): el test es vlido si E>5, con:
Min (a1 ; a 2 ) Min (n1 ; n 2 )
E= (8.57)
N
en donde E, por razones que se vern en el Captulo X, es conocida como la m-
nima cantidad esperada. Desgraciadamente la condicin de validez anterior, a
pesar de ser la clsica de la literatura, no es muy adecuada pues solo es vlida si
los marginales son pequeos y equilibrados (Martn and Herranz, 2000). Martn
et al (2004a) justifican terica y prcticamente que la condicin de validez real
es E>0 para el test de dos colas (lo que implica que siempre es vlido), pero pa-
ra una cola ha de ser E20,7 (aunque si N500 basta con E8,8).
10 BIOESTADSTICA

Ejemplos 8.10 y 8.11 (continuacin): Como ambos tests son de dos colas no es preciso
comprobar la condicin de validez (bajo la condicin clsica ninguno de los
dos casos puede resolverse por el test asinttico, pues E = 69/19 = 2,8 5
y E = 404/80 = 2 5). Aplicando la (8.56) a la Tabla 8.6(b):
5 4 19

6 13 2 6 13
zexp = = 1,64
9 10 19

19 19 6 13
y el mtodo clsico (y errneo) indica que 10%<P<11% al comparar zexp=
1,64 con la Tabla 2: el resultado es muy discrepante con el valor exacto de
P=5,72%. La razn de ello es que no se ha aplicado el siguiente criterio co-
rrecto de Mantel: 1) Como x1=5 > 0=69/19=2,8, entonces P1 = P(z1,64)
= 5,05% por la Tabla 1; 2) x1 = [22,85] = [0,6] = 0, valor que se corres-
ponde con la ltima tabla de la Tabla 8.7 y al que hay que aplicarle de nue-
vo la (8.56):
0 9 19

6 13 2 6 13
zexp = = 2,32
9 10 19

19 19 6 13
Con ello P2 = P(z2,32) = 1,02%; 3) Finalmente P = 5,05%+1,02% =
6,07%, valor prcticamente igual que el exacto de P=5,72%. Hacer bien las
cosas tiene su recompensa.
Procediendo de modo similar con los datos del Ejemplo 8.11 se obtie-
ne que zexp=1,54 y P = 26,18% = 12,36% por la Tabla 1 y por ambos pro-
cedimientos (el resultado es el mismo porque n1=n2 y la Hipergeomtrica es
simtrica) frente al valor exacto de 11,56%. El obtenido por la aproxima-
cin de Poisson (ver Ejemplo 8.11) fue ligeramente peor (12,5%), lo que es
un resultado general: si se puede, debe aplicarse la aproximacin Normal
antes que la aproximacin de Poisson.
Ver al final la Prcticas de Ordenador D

B Por paralelismo de la (8.54) con la (5.9) se obtiene que un intervalo de


confianza para la diferencia de proporciones es :
p q p q N
p1 p2 ( p 1 p 2 ) z 1 1 2 2 con z en la Tabla 2 (8.58)
n1 n2 2n1n 2
expresin en la que se han sustituido las cantidades desconocidas pi y qi por sus
estimaciones y se ha aadido la c.p.c. condicionada clsica. Las condiciones de
validez son ahora que todas las ni p i y ni q i sean mayores que 5, lo que equivale
a afirmar que todas las cantidades del interior de la Tabla 8.6(a) sean mayores
que 5 (x1, x2, y1, y2 > 5).
En nuestro ejemplo de la Tabla 8.6(b) la condicin no se verifica y el inter-
valo no debe calcularse. Si se hiciera (solo por practicar) al error del 5%:
5 4 5 1 4 9 19
p1 p2 1,96 3 = (1,41%; 100,4%)
6 13 6 3
13 2 6 13
resultado que requiere ser comentado. En primer lugar no tiene sentido el ex-
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 11

tremo superior del 100,4%, que debe redondearse al 100% (lo mximo permiti-
do). En segundo lugar se observa que el intervalo no contiene al 0, y sin embar-
go el test aproximado no dio significativo al error =5%: estas son las incon-
gruencias de las que se avisaron en el apartado 6.9.2.
Existen dos expresiones alternativas (y mejores) que la (8.58). La primera es muy
sencilla, se debe a Agresti and Caffo (2000): utilizar la (8.58) sin c.p.c. y con todos los
datos del interior de la tabla incrementados en z 2 / 4 (y, lgicamente, los del exterior
incrementados en z 2 / 2 ). El intervalo as obtenido, 6,06% p1p2 +90,07%, no pre-
senta ninguna de las desventajas del anterior y es ms cercano al intervalo exacto 1,7%
p1p2 79,3% de 8.13.4. La segunda, debida a Martn and Herranz (2003), es ms
complicada pero ms exacta. Ahora, de nuevo para =5%:
A=z 2 (n 2 n1 ) 2 n1n 2 +Nn1n 2
2 p
d=p 1 2
B B C
con B=z (n 2 n1 )(a 2 a1 ) 2Nn1n 2 (d c);
2
N (8.59)
2A 2A A c=
C=Nn1n 2 (d c) 2 z 2 a1a 2 2n1n 2

lo que proporciona el intervalo 7,85% p1p2 78,16%. Para grandes muestras, una
simplificacin de lo anterior es la expresin que sigue (que proporciona el intervalo
1,12% p1p2 93,65%) en la que c y d son como antes (cuando c=0, la expresin
que sigue es la misma de (8.58) sin la c.p.c. final):
a1a 2 (d c)(n 2 n1 )(a 2 a1 ) (d c) 2 (n 2 n1 ) 2 n1n 2
(d c) z
Nn1n 2
C En cuanto al tamao adecuado de muestra para que un test al error detec-
te una diferencia =p1p2 entre las dos proporciones el 100(1 )% de las
veces en que esta se produzca, hemos de considerar que por la (8.54), y asu-
miendo el diseo ptimo de n1=n2=n y que =p1p2, se obtiene que p 1 p 2
N{0; 2pq / n } bajo H0 y p 1 p 2 N{; (p1q1 p2 q 2 ) / n } bajo H1. La (7.10)
aplicada con estas expresiones proporciona la frmula deseada (cambiar por
2 si el test es de dos colas), en donde p = (p1+p2)/2, las z se miran en la Tabla
2 y la segunda expresin alude al valor de n para el test con c.p.c.:
2
z 2pq z2 p1q1 p2 q 2
2
n 4
n= , nC 1 1 (8.60)
4 n

Como las cantidades pi son desconocidas, debe sustiturselas por estimaciones
que hagan mxima la expresin anterior (para que as sobre muestra). Para ello:
1) Cuando no se tiene conocimiento alguno acerca de las pi, lo mejor es sustituir
(p1q1+p2q2) por lo mximo que pueda valer bajo la condicin =p1p2.
Puede demostrarse que el mximo se alcanza cuando las pi valen 0,5/2, y
as Mx (p1q1+p2q2) = (12)/2 y p=1/2. Sustituyendo arriba:
2
1 z z 2 1
2

n= con las z en la Tabla 2 (8.61)


2

2) Cuando se conoce algo acerca de las pi, lo mejor y ms conservador es asig-
narle a p1 y p2 aquellos valores que sean lo ms cercanos posibles a 0,5/2,
12 BIOESTADSTICA

compatibles con la informacin y compatibles con el valor asumido. Tn-


gase en cuenta que cuando el test es de una cola ha de verificarse lo lgico:
p1=p2+ para la alternativa H1p1>p2 y p1=p2 para la alternativa H1p1<p2.
La informacin acerca de las pi puede provenir de la bibliografa o de una
muestra piloto (pues las dos parejas de valores xi y ni de ella permiten obtener
dos intervalos de confianza para pi que originan la informacin). Por ejemplo,
si ha de ser =10% en un test de dos colas y se sabe que 10%<p1<33% y que
15%<p2<40%, entonces como 0,5/2 son los valores 45% y 55%, hay que
elegir p2=40% (el valor de la informacin de p2 que ms se acerca al 45% o al
55%) y p1=30% (pues de los dos valores posibles que respetan , p210% =
40%10%, el 30% es el nico compatible con la informacin).
La primera solucin es siempre correcta (pues proporciona un valor de n
superior al real); la segunda puede que no, conviniendo comprobar al final (una
vez obtenida la muestra y si se concluye H0) que H0 es fiable (Comentario 6.15).
Ejemplo 8.12: Un ensayo clnico tiene por fin comparar los porcentajes de xitos de un
tratamiento nuevo (el n 2) frente a uno estndar (el n 1) a travs de dos
muestras independientes. Si se va a realizar el test al 5% de error y se
desea una potencia del 80% para la alternativa de que el nuevo supera al
clsico en un 10%, cuntos individuos hay que tomar si se sabe que el
clsico tiene xito entre el 70% y el 80% de la veces?
Si p2 (p1) son las verdaderas proporciones de curaciones con el trata-
miento nuevo (clsico), el test a realizar ser de H0 p2=p1 vs. H1
p2>p1, pues el objetivo es demostrar que el nuevo supera al clsico. Co-
mo =10%, entonces necesariamente p2 = p1+10%. Como se sabe que
70% p180% y 0,5/2 = 45% y 55%, entonces lo peor que le puede
pasar a p1 es que valga p1=70%; por tanto p2=80% y p = (p1+p2)/2 =
75%. Finalmente, como =5% y =20% entonces z2=1,645 (2 por tra-
tarse de un test de una cola) y z2=0,842 en la Tabla 2. Por 1 de (8.60):
2
1, 645 2 0, 75 0, 25 0,842 0, 7 0,3 0,8 0, 2
n= =230,9 231
0,1

y corrigiendo por c.p.c. a travs de la segunda expresin (8.60):
2
230,9 4
n= 1 1 = 250,5 251
4 230,9
con lo que la solucin es n1=n2=251: hay que tomar 251 enfermos en ca-
da grupo. La solucin exacta de Casagrande et al (1978) es n=249. Se ve
cmo la solucin con c.p.c. es casi perfecta (251), pero que la solucin
clsica de la literatura (231) es bastante liberal.
La (8.60) se construy pensando que n2=n1 (=n), pero ya se indic en 8.3.1.3C que
cuando el costo de cada observacin es diferente el tamao de muestra tambin debe
serlo. Razonando como al principio de 8.8.1.3C, pero en base al diseo ptimo de n2=
tn1, y despejando n1, se obtiene la nueva frmula:
2
1 z (t 1)pq z 2 tp1q1 p2 q 2
p tp2 c
n1 = , con p= 1 y t= 1 (8.62)
t
1 t c 2

en donde las ci aluden al costo de cada elemento de cada muestra. El valor mximo de
esa expresin (a aplicar cuando no se tiene informacin acerca de las pi) es:
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 13
2 2
t+1 4(t 3 1) 2 n 2 t 1
n1 = z z 2 1 , nC 1 1 1 (8.63)
4t2 (t 1) 3
4 tn1
en donde la segunda expresin, que se basa en el valor obtenido en la primera, alude al
tamao de muestra con c.p.c. As, para los datos del Ejemplo 8.12 con t=0,5 (los ele-
mentos de la segunda muestra cuestan 4 veces ms que los de la primera), p1=0,7 y
p2=0,8 se obtiene n1=350,99 (sin c.p.c.) y n1=380,4 (con c.p.c.). Por consiguiente,
n1=381 y n2 = 0,5381 = 191.

8.8.2 Mtodo incondicionado

8.8.2.1 Test exacto

A En 8.8.1.1A se cit el problema de eliminar el parmetro perturbador p (=p1


=p2), indicando que el mtodo condicionado lo haca, como su propio nombre
indica, por condicionamiento en un estadstico apropiado. El mtodo incondi-
cionado actual lo hace por maximizacin. Para ver la dificultad operativa del
mtodo describamos brevemente su modo de actuacin. Como bajo H0 xi
B(ni; p), la probabilidad de un resultado como el de la Tabla 8.6(a) es P(x1; x2) =
P(x1)P(x2), pues las dos v.a. son independientes, en donde P(xi) aluden a la
probabilidad de cada Binomial. Sea ahora RC una determinada regin crtica
(conjunto de parejas de valores (x1; x2) que permiten concluir H1); su error
ser (p) = RC P(x1)P(x2) y depende del parmetro perturbador p. Como no se
sabe cul es el verdadero valor de p, lo nico factible es calcular su valor mxi-
mo posible - = Max0<p<1 (p)- y ello es lo que hace tremendamente complejos
los clculos. El lector interesado puede obtener gratuitamente el programa en
http://www.ugr.es/local/bioest/SMP.EXE. Por ejemplo, para los datos de la Ta-
bla 8.6(b), se obtiene (por el orden Z de ese programa) P=3,11% (una cola) y P=
4,60% (dos colas), valores ms pequeos que los 4,95% y 5,72% del test exacto
de Fisher; para los datos del Ejemplo 8.11 se obtiene P=2,14% (una cola) y P=
4,28% (dos colas), valores bastante ms pequeos tambin que los 5,78% y
11,56% del test exacto de Fisher.
El mtodo incondicionado proporciona tests ms potentes (e intervalos de
confianza ms estrechos) que el condicionado, pero ello es a costa de un muy
superior esfuerzo de cmputo; de hecho hoy da no es posible calcular el valor P
incondicionado cuando ni200. Sin embargo, las diferencias entre ambas meto-
dologas se amortiguan conforme aumenta el tamao de muestra, de modo que
para ni70 los resultados de ambas son similares (Martn et al, 2004b).

Ver al final la Prctica de Ordenador B


B Como se ha visto, el test exacto de Barnard es imposible de realizar a ma-
no, siendo especialmente conveniente disponer de unas tablas que lo eviten. La
construccin de las mismas es dificultosa por cuanto la doble Binomial depende
de dos parmetros (n1 y n2) y de dos v.a. (x1 y x2), lo que hace que las tablas se-
an demasiado extensas. La Tabla 17 es un ejemplo muy reducido de ellas; tablas
ms completas (y en el mismo formato) pueden encontrarse en la direccin
http://www.ugr.es/~bioest/crb2p.pdf.
Para poder utilizar la Tabla 17, como indica su nota a pi de pgina, es pre-
14 BIOESTADSTICA

ciso reordenar la tabla experimental de modo que suceda que:


n1 n2 y p 1 = x1 / n1 > p 2 = x 2 / n 2 (8.64)
pero para ello no es preciso reordenar la tabla de modo estricto, sino que basta
con anotar en ella quines son los valores clave: n1, n2, x1 y x2. Veamos el modo
de actuar para los datos de la Tabla 8.6(b). Si el test es de una cola a la izquierda
(H1 p1<p2), como experimentalmente ocurre que p 1 =5/6 > p 2 =4/13, el test no
ser significativo y el problema finaliza. Si la alternativa fuera de una cola a la
derecha (que es compatible con los datos) o si el test es de dos colas, entonces
se procede como sigue:
1) Como n1=6 n2=13, las muestras estn bien ordenadas.
2) La pareja (x1; x2) puede ser la (5; 4) o la (1; 9), aquella que verifique la se-
gunda condicin de la (8.64): como 5/6 > 4/13, ser x1=5 y x2=4.
3) Con todo ello los valores clave son n1=6, n2=13, x1=5 y x2=4. Para ver la sig-
nificacin debe localizarse en la Tabla 17 la terna de nmeros (n1=6; n2=13;
x1=5), por ese orden, en la columna de UNA COLA (o de DOS COLAS); ella
proporciona los tres nmeros C=6, 4 y 2 (o C=4, 3 y 2) correspondientes a
los errores del 10%, 5% y 1% respectivamente. Como la significacin se
obtiene cuando x2C, entonces al ser C1%=2 < x2=4 C5%=4 (o C5%=3 <
x2=4 C10%=4), el test es significativo para =5% (o 10%) y no lo es para
=1% (o 5%), es decir 1%<P5% (o 5%<P10%) lo que es compatible con
el resultado exacto de P=2,65% (o P=5,56%).

C Con el mtodo incondicionado actual es posible calcular intervalos de con-


fianza exactos para p1p2, pero, por lo dicho arriba, se comprender que las di-
ficultades de clculo son importantes. Ms adelante (apartado 8.13.4) se retor-
nar a este asunto.
8.8.2.2 Caso en que es vlida la aproximacin a la Normal

A La argumentacin empleada el 8.8.1.3 fue de tipo incondicionado, convir-


tindose su resultado en condicionado solo por causa de la c.p.c. que se incluy.
Por ello, para obtener el test asinttico incondicionado basta con cambiar la
c.p.c. condicionada N/2n1n2 de la (8.56) por la c.p.c. incondicionada que sigue
(Martn et al, 2002) que es despreciable con muestras moderadamente grandes:
p 1 p 2 c 1/n n si n1 n 2
zexp = , con c= 1 2 (8.65)

pq
N 2/n1n 2 si n1 n 2
n1n 2
Para test de una cola a la derecha (H1 p1>p2) la comprobacin previa a
realizar es que p 1 p 2 . Para el test de dos colas ahora no debe aplicarse el crite-
rio de Mantel, sino el clsico de Armitage, es decir la cantidad zexp se puede
comparar directamente con la Tabla 2. En todo caso la (8.65) ha de entenderse
en el sentido de la expresin (7.12). Martn et al (2004a) justifican terica y
prcticamente que el test de una (dos) colas es vlido si E14,8 (E14,9), aun-
que si N500 basta con E7,2 (E7,7).
Ejemplos 8.10 y 8.11 (continuacin): En ninguno de los dos casos el test asinttico es
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 15

fiable pues E=2,8 < 7,7 y E=2 < 7,7 respectivamente. Si, por practicar, se
aplica la (8.65) a la Tabla 8.6(b):
5 4 1

6 13 6 13
zexp = = 2,08
9 10 19

19 19 6 13
lo que da 3%<P<4% al mirar en la Tabla 2 o P = 21,88% = 3,76% al hacerlo
en la Tabla 1: el resultado es moderadamente discrepante con el valor exacto de
P= 5,56%. Procediendo de modo similar con los datos del Ejemplo 8.11 se ob-
tiene que zexp=2,03 y P = 22,12% = 4,24% por la Tabla 1 (valor muy cercano
al exacto de 4,12%).
Ver al final la Prctica de Ordenador D
B El mismo argumento de antes es aplicable tambin al intervalo de confianza
para la diferencia de proporciones; la (8.58) es ahora:

p q p q 1/n n si n1 n 2
p1 p2 ( p 1 p 2 ) z 1 1 2 2 c , con c= 1 2 (8.66)
n1 n2 2/n1n 2 si n1 n 2
con las mismas condiciones de validez de entonces: x1, x2, y1, y2>5. Las expre-
siones (8.59) y siguiente son vlidas si en ellas se pone el actual valor de c.
C Finalmente, para el tamao de muestra son vlidas las expresiones (8.60) a
(8.63) sin necesidad de corregirlas por c.p.c., pues la nueva cantidad c le influye
de modo despreciable. Por ello ahora es vlida la solucin directa de n=231 del
Ejemplo 8.12.

10.3 TEST DE HOMOGENEIDAD DE VARIAS MUESTRAS CUALITA-


TIVAS
10.3.1 Caso general de una tabla rs

10.3.1.1 Presentacin de los datos

Consideremos dos tratamientos A y B que curan una misma enfermedad. Si


los aplicamos a dos muestras independientes de n1 y n2 enfermos respectiva-
mente, y anotamos cuntos de ellos se curan y cuntos no, el problema es una
comparacin de dos proporciones independientes (las de los curados con cada
tratamiento) y los datos adoptan la forma de una Tabla 22 como la de la Tabla
8.6(a). Si los individuos se clasifican ms finamente, anotando si tras el tra-
tamiento estn Peor, Igual o Mejor, los datos adoptan la forma de una
Tabla 23 y el problema no sabemos an resolverlo. Si hay ms de dos trata-
mientos (como por ejemplo 4) los datos adoptan la forma de la Tabla 10.4, que
es una Tabla 43. En ella, por conveniencia nemotcnica, al nmero de indivi-
duos de cada muestra se le llama Fi (aludiendo a que es el total de la fila i) y al
16 BIOESTADSTICA

nmero observado de individuos que caen en cada clase se le llama Oij (con i
aludiendo al nmero de fila y j al nmero de columna). As, O23=85 indica que
de entre los individuos que reciben el tratamiento 2 hay 85 que mejoran (y caen
en la columna 3). Sumando por columnas, Cj alude al total de individuos de la
columna j, y as C1=37 indica que empeoraron un total de 37. Obviamente C1+
C2+C3 = 560 = F1+F2+F3+F4 y T=560 es el gran total (nmero total de indivi-
duos que intervienen en la experiencia).
De modo general puede contarse con r muestras (tratamientos en nuestro
ejemplo) cuyos individuos se clasifican en s clases (grado de mejora en nuestro
ejemplo) dando lugar a una Tabla rs como la Tabla 10.5. En todo caso ser:
Oij = n de individuos en la fila i columna j;
Fi = jOij = total de la fila i = tamao de la muestra i;
Cj = iOij = total de la columna j = n total de individuos en la clase j;
T = i, jOij = iFi = jCj = gran total = n total de individuos.
Tabla 10.4
Clasificacin de 4 grupos de individuos segn su estado tras 4 tratamientos.
Oij Peor Igual Mejor Totales
Tratamiento 1 7 = O11 28 = O12 115 = O13 150 = F1
Tratamiento 2 15 = O21 20 = O22 85 = O23 120 = F2
Tratamiento 3 10 = O31 30 = O32 90 = O33 130 = F3
Tratamiento 4 5 = O41 40 = O42 115 = O43 160 = F4
Totales 37 = C1 118 = C2 405 = C3 560 = T

10.3.1.2 Hiptesis a contrastar

En el caso de una Tabla 22 el problema era comparar las 2 proporciones


de curados, una con cada tratamiento, no incluyndose la de no curados pues
ellos son el complementario a uno de las anteriores; la solucin se dio en el Ca-
ptulo VIII. En nuestra Tabla 43 no solo hay 4 muestras en lugar de slo 2 (con
lo que debern compararse 4 proporciones) sino que hay 3 clases en lugar de s-
lo 2 (con lo que las 4 proporciones a comparar constituyen 2 grupos, pues el ter-
cero es consecuencia de restar de 1 a los anteriores). Por ello la hiptesis nula a
contrastar (los 4 tratamientos son igualmente efectivos) es equivalente a afirmar
que la proporcin de individuos peor es la misma con los 4 tratamientos, que
la proporcin de individuos igual es la misma con los 4 tratamientos y que la
proporcin de individuos mejor es la misma con los 4 tratamientos (aunque
esta ltima afirmacin sobra una vez hechas las dos primeras). Desde luego, la
hiptesis alternativa ser la negacin de la anterior. En general, para una Tabla
rs las hiptesis a contrastar sern:
H0 Los r tratamientos son todos iguales
La proporcin de individuos que caen en una determinada clase es
la misma con los r tratamientos (y esto vale para todas las clases)
H1 Los r tratamientos no son todos iguales
Alguna de las afirmaciones anteriores no es cierta
en donde H1 no es lo mismo que el que todos los tratamientos sean distintos o el
que todas las afirmaciones sean falsas.
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 17
Tabla 10.5
Clasificacin de r muestras (filas) en s columnas (clases).
Clases
Oij Totales
1 2 j s
1 O11 O12 O1j O1s F1
2 O21 O22 O2j O2s F2
. . . . . .

. . . . . .
Muestras i Oi1 Oi2 Oij Ois Fi
. . . . . .

. . . . . .
r Or1 Or2 Orj Ors Fr
Totales C1 C2 Cj Cs T

La H0 actual es realmente una afirmacin muy fuerte. Si en el ejemplo de


arriba notamos por pi, pi y pi a la proporcin de individuos del tratamiento i
que caen en la clase Peor, Igual y Mejor respectivamente, entonces:
H0 p1=p2=p3=p4; p1 p2 p3 p4 ; p1 p2 p3 p4
lo que implica que el test debera dar significativo en cuanto una de tales igual-
dades sea falsa (cosa distinta es que el tamao de muestra no logre detectarlo).

10.3.1.3 Obtencin de las cantidades esperadas. Condiciones de validez

Para ilustrar el modo de calcular las cantidades esperadas Eij fijmonos por
ejemplo en el caso de E23: el nmero de individuos que, recibiendo el tratamien-
to 2, deberan de caer en promedio en la clase mejor si H0 fuera cierta. Si H0
es cierta la proporcin p3 de individuos que mejoran es desconocida, pero es es-
timable por p 3 = n total de mejorados / gran total = 405/560 = C3/T. Como el
tratamiento 2 fue aplicado a F2=120 enfermos, el nmero esperado de ellos que
mejoran ser E23 = F2 p 3 = F2C3/T = 405120/560 = 86,79. La regla general
es ya obvia:
Fi C j (Total de su fila) (Total de su columna)
E ij = = (10.8)
T Gran Total
y a partir de ella se construye la Tabla 10.6. En ella, los totales de fila y de co-
lumna coinciden con los de la Tabla 10.4 que la origin, lo que no es por azar
sino que es consecuencia de la definicin de las Eij: por ejemplo, para las filas,
jEij = j(FiCj)/T = (Fi/T)jCj = Fi (de igual modo con las columnas).
Tabla 10.6: Cantidades esperadas para los datos de la Tabla 10.4.
Eij Peor Igual Mejor Totales
Tratamiento 1 E11 = 9,91 E12 = 31,61 E13 = 108,48 F1 = 150
Tratamiento 2 E21 = 7,93 E22 = 25,28 E23 = 86,79 F2 = 120
Tratamiento 3 E31 = 8,59 E32 = 27,39 E33 = 94,02 F3 = 130
Tratamiento 4 E41 = 10,57 E42 = 33,72 E43 = 115,71 F4 = 160
Totales C1 = 37 C2 = 118 C3 = 405 T = 560
18 BIOESTADSTICA

Las condiciones de validez del test 2 son las de siempre; por ello en nues-
tro ejemplo el test que sigue es vlido pues todas las Eij son mayores que 5. Si
las condiciones de validez no se verificaran, el problema presenta complicacio-
nes y la mejor solucin es ampliar la muestra. Ahora, la solucin de juntar cla-
ses es problemtica dada la estructura de las Tablas rs: juntar dos filas implica
juntar dos tratamientos en uno slo (y no nos consta que sean iguales); juntar
dos columnas es juntar dos clases en una sola (y no nos consta que la significa-
cin no radique en una de ellas); juntar dos casillas contiguas individuales altera
la estructura del problema y requiere de mtodos especiales (ver Rao, 1970).
10.3.1.4 Obtencin de la cantidad experimental

El resto del camino es ya equivalente al de la seccin anterior. La discre-


pancia entre lo observado y lo esperado se mide por la tradicional exp2
que,
puesta en los nuevos trminos, ser:

O E ij
2
Oij2
E
ij
2
exp = = T (10.9)
i, j E ij i, j ij

La c.p.c. no es ahora precisa nunca pues el nmero de casillas K = rs siempre


es mayor que 4 (salvo en el caso de una Tabla 22 que es especial y se ve ms
adelante). Para nuestro ejemplo:
72 282 1152
exp
2
= ... + 560 = 13,86
9,91 31,61 115,71
aunque, para no confundir unas casillas con otras, convienen presentar juntas las
Oij y Eij en el modo indicado en la Tabla 10.7.

10.3.1.5 Obtencin de la cantidad terica y realizacin del test


Para calcular los g.1. indicados en (10.4) hay que tener en cuenta que ahora
K=rs (pues hay rs casillas en total). Los parmetros que es preciso estimar
son p 1 (para la primera columna), p 2 (para la segunda),..., p s (para la ltima),
aunque este ltimo no es preciso estimarlo pues todos deben sumar 1, lo que
hace un total de p=(s1). El nmero h de muestras es ahora h=r. Con todo ello
g.1. = rs(s1)r = (r1)(s1) y as:
g.1. = (r1)(s1) (10.10)
Para nuestro ejemplo g.1. = (41)(31) = 6. La interpretacin intuitiva de los
g.l. puede hacerse bastante bien a partir de la Tabla 10.6: ntese que, una vez
calculadas las Eij enmarcadas en la lnea retintada (E11, E12, E21, E22, E31 y E32) a
travs de la (10.8), el resto no es preciso calcularlas igual pues estn condicio-
nadas por los totales (E13 = F1E11E12 = 108,48 por ejemplo), lo que indica que
slo hay 6 cantidades esperadas libres y de ah los 6 g.l.
Para realizar el test basta comparar exp
2
=13,86 con una 2 (g.1.=6) de la
Tabla 7, lo que da P<5% y as no todos los tratamientos son iguales.
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 19
Tabla 10.7: Presentacin conjunta de los datos de las Tablas 10.4 y 10.6
Oij Peor Igual Mejor Totales
Eij
7 28 115
Tratamiento 1 9,91 31,61 108,48 150
15 20 85
Tratamiento 2 7,93 25,28 86,79 120
10 30 90
Tratamiento 3 8,59 27,39 94,02 130
5 40 115
Tratamiento 4 10,57 33,72 115,71 160
Totales 37 118 405 560

10.3.2 Caso particular de una tabla 22

A Cuando slo se dispone de dos muestras (r=2) cuyos individuos son clasi-
ficados en dos clases (s=2) se est en presencia de una tabla 22 y el problema
ya sabemos resolverlo por dos mtodos distintos: el de la seccin actual y el de
la seccin 8.8. Desde luego que es deseable que ambas tcnicas coincidan (para
que as los mtodos estadsticos sean coherentes) y en esencia esto es lo que su-
cede (con alguna matizacin que se ver). Para estudiar esto, la Tabla 10.11 pre-
senta en su parte (a) el formato de los datos con la notacin de un test 2 y en su
parte (b) el formato con la notacin del test de comparacin de dos proporciones
independientes. Entonces:

1) En el contexto actual, la hiptesis nula es que los porcentajes de ses (pi) son
el mismo en las dos poblaciones (H0 p1=p2) -y por tanto tambin los de no-
es-; ella es justamente la H0 del test de la seccin 8.8: las H0 coinciden;
2) Segn la regla de validez del Comentario 10.1, el test 2 es vlido si todas las
Eij = FiCj/T son mayores que 5 (pues en una tabla 22 sucede que K=4 y el
20% de 4 es inferior a l), lo que es equivalente a afirmar que lo sea la menor
de ellas (lo que se conoce como mnima cantidad esperada):
Min Fi Min C j
E= (10.11)
T
cantidad que coincide con la (8.57) si se tiene en cuenta el cambio de nota-
cin. Pero la condicin E>5 es tambin la clsica citada en 8.8.1.3, de modo
que las condiciones de validez clsicas tambin coinciden;
Tabla 10.11: Presentacin general de los datos de una Tabla 22.
(a) Como un test 2. (b) Como un test de comparacin de dos
proporciones independientes.

Clases Clases
S NO Totales S NO Totales
Muestras Muestras
1 O11 O12 F1 1 x1 y1 n1
2 O21 O22 F2 2 x2 y2 n2
Totales C1 C2 T Totales a1 a2 N
20 BIOESTADSTICA

3) La (10.2) indica que exp2


= (O11E11)2/E11+..., pero O11E11 = O11F1C1/T =
(O11TF1C1)/T = (O11O22O12O21)/T si se sustituyen F1, C1 y T por sus valo-
res en trminos de Oij, de modo que procediendo igual con las dems se tiene
que exp
2
= {(O11O22O12O21)2/T2}(1/Eij). Como (1/Eij) = T{1/(FiCj)},
entonces, poniendo comn denominador a todas las fracciones y operando,
queda que (1/Eij) = T(F1+F2)(C1+C2) / {F1F2C1C2} = T3/{F1F2C1C2}. Final-
mente, sustituyendo arriba se obtiene la siguiente expresin simplificada:

O11O22 O12 O21


2

exp
2
= T (10.12)
F1F2 C1C2
que, siendo equivalente a la (10.2), suele ser aludida como 2 sin c.p.c. o no
corregida por continuidad. La cantidad exp 2
est limitada en su utilizacin al
caso de las particiones de tablas -pues en ellas no hay que hacer c.p.c.- y al
caso del coeficiente phi que se ve ms adelante. En realidad, por el Comenta-
rio 10.2, la exp
2
debera llevar c.p.c. (pues K=4 4), de modo que procedien-
do igual con la (10.6) se obtiene la siguiente 2 de Yates:
2
T
O11O 22 O12 O 21
2Y =
2
T (10.13)
F1F2 C1C 2
Pero poniendo la (8.56) en los trminos actuales, y operando, es fcil ver que
2
z exp 2Y y as las cantidades experimentales de ambos tests son equivalen-
tes (e igual pasa con las cantidades experimentales sin c.p.c.);
4) Finalmente, la cantidad zexp de entonces haba que compararla con una z de
la Tabla 2, en tanto que la cantidad 2Y de ahora ha de compararse con una
2 (1 g.l.) de la Tabla 7 (pues al ser r=s=2 los g.l. sern (21)(21) = 1). Pe-
ro ya se ha dicho en otra ocasin que z 2 2 (1 g.l.) , y as las cantidades te-
ricas de ambos test tambin coinciden.
Como consecuencia de todo lo anterior, el anlisis asinttico clsico de
una tabla 22 puede abordarse indistintamente por la tcnica de 2 -expresin
(10.13)- o por la tcnica z del test condicionado de comparacin de dos propor-
ciones independientes -expresin (8.56)-, pues ambos tests son el mismo, siendo
la eleccin de uno u otro una cuestin de gustos (aunque si con posterioridad se
va a determinar el intervalo de confianza o el tamao de muestra, puede que se
prefiera el test z por ser aprovechables algunos de sus clculos). De hecho, co-
mo el mtodo actual es ms cmodo (pues requiere menos operaciones), pero
tambin es ms impreciso (pues la Tabla 7 es menos extensa que las Tablas 1 y
2), los investigadores suelen obtener ambas ventajas calculando 2Y , haciendo
zexp = Y y razonando ya en base a las Tablas 1 o 2 y a lo indicado en 8.8.1.3.
De lo anterior tambin se deduce que como el test de (8.56) es un test de
dos colas, asinttico, condicionado y aplicado en el sentido clsico de Armi-
tage, el test actual de la (10.13), que le es equivalente, tambin lo ser; de ah
que el test general de donde proviene tal expresin -el de (10.6)- tambin verifi-
ca todas esas caractersticas. Sin embargo, en una tabla 22 es factible mejorar
las cosas en base a lo indicado en 8.8.1.3; recopilando lo indicado all, se dedu-
ce que para aplicar el test de (10.13) hay que actuar as:
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 21

(a) Cuando el test es de una cola a la derecha (H1 p1>p2) la comprobacin pre-
via a realizar -antes de calcular el valor P por la Tabla 7 y dividirlo por 2- es
que p 1 =O11/F1 > p 2 =O21/F2. El test es vlido si E20,7 o si {T500 y
E8,8};
(b) Cuando el test es de dos colas (H1 p1p2) resulta ms potente aplicar el test
2Y con la precaucin de Mantel de la seccin 7.5, en donde la variable es
O11 con media 0 = F1C1/T (el test 2 del captulo actual se utiliza bajo el cri-
terio de Armitage pues con tablas superiores a 22 las diferencias son irre-
levantes). Ahora el test es siempre vlido (en contraste con la clsica condi-
cin de validez E>5 que utilizaremos solo para tablas superiores a 22);
(c) En todo caso la (10.13) ha de entenderse en el sentido de la expresin (7.12),
de modo que cuando O11O22O12O21 T/2 entonces 2Y =0 (lo que es
compatible con lo que se dijo para una tabla de orden superior a 22).

B El estadstico 2Y de la (10.13) es condicionado y, como se ha visto, equi-


valente al de la expresin (8.56). El mismo razonamiento del prrafo A permite
obtener el estadstico C2 siguiente:

O O 22 O12 O 21 c
2
11 1 si n1 n 2
=
2
C T, con c= (10.14)
F1F2 C1C 2 2 si n1 n 2
que, siendo equivalente al estadstico incondicionado de la expresin (8.65), se
aplica con los criterios indicados en 8.8.2.2:
(a) Cuando el test es de una cola a la derecha (H1 p1>p2) la comprobacin pre-
via a realizar es que p 1 =O11/F1 > p 2 =O21/F2. El test es vlido si E14,8 o si
{N500 y E7,2};
(b) Cuando el test es de dos colas (H1 p1p2) se aplica el criterio clsico (el de
Armitage). El test es vlido si E14,9 o si {N500 y E7,7}
(c) En todo caso la (10.14) ha de entenderse en el sentido de la expresin (7.12),
de modo que cuando O11O22O12O21 c entonces C2 =0.

C En la seccin 8.8 se hicieron varias distinciones que, siendo de aplicacin a


lo actual, conviene aclarar. En primer lugar, los datos pueden analizarse por m-
todos exactos o por mtodos asintticos. Los mtodos exactos de all tambin
son de aplicacin aqu, pues se trata del mismo problema (en el caso de tablas
rs distintas de 22 tambin existen mtodos exactos, pero requieren paquetes
estadsticos especiales como STATXACT). En segundo lugar, los datos pueden
analizarse por el mtodo condicionado o por el mtodo incondicionado. En el
caso de tablas rs distintas de 22 la distincin es irrelevante, pues los valores P
que se obtienen son muy similares, pero en las tablas 22 los resultados pueden
llegar a ser muy diferentes (como se vio en la seccin 8.8).
Ejemplo 10.3: Resolver por 2 el Ejemplo 8.10.
Las expresiones (10.13) y (10.14) son ahora:
2
19
5 9 1 4 5 9 1 4 1
2

Y =
2 2
19 2, 686; C =
2
19 4,330
6 13 9 10 6 13 9 10
22 BIOESTADSTICA

y sus races cuadradas dan zexp=1,64 y zexp=2,08 respectivamente; estos


valores son los mismos que se obtuvieron en el Captulo VIII. El resto de
la discusin es como all. En particular, para aplicar el criterio de Mantel
se tiene que O11=5 > 0=69/19=2,8 y as O11 = [22,85] = [0,6] = 0,

con lo cual el valor de Y para la nueva tabla es:
2

2
19
0 4 69
Y2 =
2
19 5,360
6 13 9 10
con lo que zexp=2,32 como en el Captulo VIII.
Si se prefiere utilizar directamente la Tabla 7, en el caso incondicio-
nado el valor C2 =4,330 indica que 2,5%<P<5%, lo que concuerda (pero
es ms impreciso) con los valores 3%<P<4% y P=3,76% de la 8.8.2.2.

Ver al final la Prctica de Ordenador D

10.4 TEST DE INDEPENDENCIA ENTRE DOS VARIABLES CUALITA-


TIVAS. TABLAS DE CONTINGENCIA

Hasta ahora, y tanto en este captulo como en los anteriores, se ha conside-


rado una nica variable cualitativa o cuantitativa cuyas observaciones en una,
dos o ms poblaciones daban lugar a ciertas hiptesis convenientes de contrastar
mediante un test. En lo que sigue se aborda un problema nuevo: el caso de que
se disponga de dos variables medidas en los mismos individuos y sobre las que
nos preguntamos si existe o no algn tipo de relacin, es decir si los valores que
tome una de ellas condicionan de algn modo los valores que tome la otra. El
mtodo estadstico para responder a tal pregunta vara con el tipo de variables
implicadas. Cuando ambas son cualitativas (por ejemplo, el color de los ojos es
independiente del color de los cabellos?) la tcnica oportuna se ve a continua-
cin; cuando ambas variables son cuantitativas (por ejemplo, el peso de un in-
dividuo es independiente de su estatura?) la tcnica oportuna es la del Captulo
XII; finalmente, cuando una variable es cuantitativa y la otra cualitativa (por
ejemplo, el resultado de una operacin quirrgica es independiente de la edad
del paciente?) -caso mixto- la tcnica oportuna se ve tambin en el Captulo XII.

10.4.1 Caso general de una tabla rs


Ejemplo 10.4: En un estudio sobre tumores cerebrales se desea averiguar si existe aso-
ciacin entre la localizacin del tumor y la naturaleza del mismo. A tal
efecto se tomaron al azar 141 pacientes afectados de tumor cerebral y se
les clasific como en la Tabla 10.12. Analizar los datos.
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 23
Tabla 10.12
Clasificacin de 141 individuos con tumor cerebral segn la localizacin y
naturaleza del mismo (Maxwell, 1961).
Naturaleza
Benigno Maligno Otros Totales
Localizacin
Lbulo frontal O11 = 23 O12 = 9 O13 = 6 F1 = 38
Lbulo temporal O21 = 21 O22 = 4 O23 = 3 F2 = 28
Otras reas O31 = 34 O32 = 24 O33 = 17 F3 = 75
Totales C1 = 78 C2 = 37 C3 = 26 T = 141

A En el ejemplo, los mismos 141 individuos han sido clasificados con arreglo
a dos caractersticas cualitativas (A Localizacin de tumor y B Naturale-
za del tumor), cada una de ellas con tres clases, siendo la notacin acerca de
las frecuencias obtenidas la misma de la seccin anterior. De un modo general
los T individuos de una nica muestra pueden ser clasificados con arreglo a dos
caractersticas cualitativas A y B, la primera de ellas con r clases y la segunda
con s clases, dando as lugar a una Tabla de Contingencia rs como la Tabla
10.13 (la tabla de ejemplo era 33).
Tabla 10.13
Clasificacin de los T individuos de una muestra con arreglo a los r niveles de una
caracterstica cualitativa A y a los s niveles de otra caracterstica cualitativa B.
B 1 2 j s Totales
A
1 O11 O12 O1j O1s F1
2 O21 O22 O2j O2s F2


i Oi1 Oi2 Oij Ois Fi


r Or1 Or2 Orj Ors Fr
Totales C1 C2 Cj Cs T

Puede notarse la gran similitud entre las Tablas 10.13 y 10.5 (de ah que se
mantenga la misma notacin). La diferencia entre una y otra es que aqu hay
una nica muestra clasificada segn dos caractersticas cualitativas, en tanto que
all haba r muestras clasificadas segn una caracterstica cualitativa. Como se
ver de inmediato, no slo son parecidas las tablas sino tambin el anlisis es-
tadstico de ambas (y ello a pesar de responder a preguntas distintas).

Tabla 10.14
Porcentajes por filas para los datos de la Tabla 10.12.
(% de tumores de cada tipo en cada zona cerebral)
Naturaleza
Benigno Maligno Otros Totales
Localizacin
Lbulo frontal 60,5 23,7 15,8 100%
Lbulo temporal 75,0 14,3 10,7 100%
Otras reas 45,3 32,0 22,7 100%
24 BIOESTADSTICA

B Ahora, la pregunta relevante es si los caracteres A y B estn relacionados o


no, es decir si el nivel de A que toma un individuo condiciona algo el nivel de B
que deba tomar el mismo (y viceversa); por ello las hiptesis a contrastar son:
H0 Los caracteres A y B son independientes, vs.
H1 Los caracteres A y B son dependientes,
en donde independientes es equivalente a no relacionados o no asociados
y, lgicamente, dependientes lo ser a relacionados o asociados. Con re-
ferencia a nuestro ejemplo la pregunta clave es: el lugar que ocupa el tumor
condiciona de algn modo la gravedad de mismo? Para ver esto hace falta con-
trastar las hiptesis anteriores que tambin son equivalentes a H0 A no condi-
ciona a B vs. H1 A s condiciona a B. De suceder H1 ello no indica que si un
tumor est en el lbulo frontal necesariamente haya de ser maligno (por ejem-
plo), sino que basta con que la frecuencia relativa de tumores malignos en el l-
bulo frontal sea superior (o inferior) a su frecuencia en alguna de las otras reas
cerebrales. Para entender esto observemos la Tabla 10.14. Si H0 fuera cierta, los
3 porcentajes de cada columna deberan ser aproximadamente iguales (pues
ellos son estimaciones de los 3 porcentajes poblacionales), de modo que la cues-
tin es si son distintos por azar o porque realmente el tumor benigno (por
ejemplo) es ms abundante en unas reas cerebrales que en otras. Dada la es-
tructura del problema nada impide obtener los porcentajes por columnas y repe-
tir el razonamiento anterior con los cambios apropiados.
Si Ai (o Bj) es el suceso de que un individuo caiga en la clase i de A (o en la
clase j de B), la probabilidad de la interseccin de ambos es el producto de las
probabilidades slo cuando A y B son independientes; esto indica que las hip-
tesis anteriores son equivalentes a estas otras:
H0 P(AiBj)=P(Ai)P(Bj), i, j
H1 P(AiBj)P(Ai)P(Bj) en alguna ocasin

C Las cantidades esperadas se obtienen por el principio general de siempre:


multiplicar el tamao de muestra (T) por la probabilidad de la casilla bajo H0, es
decir Eij =TP(AiBj) = TP(Ai)P(Bj). Consideremos por ejemplo la cantidad
E21, o cantidad esperada de individuos con tumor benigno en el lbulo temporal
cuando H0 es cierta, con E21 = TP(A2B1) = TP(A2)P(B1). Las probabilida-
des anteriores son desconocidas, pero pueden estimarse por P (A2) = F2/T =
28/141 y P (B1) = C1/T = 78/141, de modo que E21 = F2C1/T = 2878/141 y se
obtiene la misma regla de (10.8). La Tabla 10.15 rene los datos de las cantida-
des observadas y esperadas para el caso del ejemplo anterior.
Tabla 10.15: Cantidades observadas y esperadas para los datos de la Tabla 10.12.
Naturaleza
T. Benigno T. Maligno Otros t. Total
Localizacin
Lbulo frontal 23 9 6
21,02 9,97 7,01 38
Lbulo temporal 21 4 3
15,49 7,35 5,16 28
Otras loc. 34 24 17
41,49 19,68 13,83 75
Total 78 37 26 141
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 25

D La discrepancia entre lo observado y lo esperado se mide por el estadstico


exp
2
clsico, con iguales c.d.v. y c.p.c. de entonces. Para nuestro ejemplo no hay
que efectuar c.p.c. pues K=9 > 4, y as:
232 92 17 2
exp
2
= ... + 141 = 7,84
21,02 9,77 13,83
Los g.l. de la 2 terica son tambin los del caso anterior -expresin (10.10)-
pues como K = rs (por haber rs casillas), p = (r1)+(s1) (pues hay que esti-
mar (r1) probabilidades P(Ai) -la ltima no es preciso estimarla pues todas han
de sumar l- y (s1) probabilidades P(Bj)) y h=1 (pues solo hay una muestra) en-
tonces g.1. = rs(r1) (s1)1 = (r1)(s1) como antes. Para nuestro caso
g.l. = (31)(31) = 4 y la cantidad exp 2
=7,84 ha de compararse con una
2 (g.l.=4) de la Tabla 7. El resultado es 5%<P<10%, lo que indica que, aunque
el mismo no es significativo, hay indicios de asociacin entre la naturaleza y la
localizacin del tumor y convendra aumentar la muestra.
E Como se ha visto el anlisis estadstico de una tabla rs que proviene de un
test de homogeneidad o de un test de independencia es idntico, y ello a pesar
de que el muestreo es distinto en cada caso (r muestras en el primero, 1 en el se-
gundo) y de que las hiptesis a contrastar son tambin distintas (homogeneidad
de muestras en un caso, independencia de caracteres en otro). De hecho, equi-
vocarse en las hiptesis a contrastar no es grave si se las considera en sentido
amplio. As, si en el ejemplo de la Tabla 10.4 se piensa que la hiptesis nula es
H0 Los caracteres tratamiento y respuesta al mismo son independientes
(que est planteada en el formato del caso actual), ello quiere decir que la me-
jora del enfermo es independiente del tipo de tratamiento, o lo que es lo mis-
mo que los 4 tratamientos son iguales, lo que constituye la misma H0 de en-
tonces. De modo similar, si en el ejemplo de la Tabla 10.12 se piensa que la
hiptesis nula es H0 La proporcin de tumores benignos es la misma en las
tres localizaciones, e igual pasa con la de tumores malignos y con los de otro ti-
po (que est planteada en el formato del caso anterior) ello quiere decir que la
naturaleza del tumor es independiente de su posicin, lo que constituye la
misma H0 de aqu.
Finalmente, sealar que el anlisis posterior de una Tabla de Contingencia
para buscar las razones de la significacin se hace tambin de igual modo que
en el test de homogeneidad (ver 10.3.1.6), pero ahora hay una ventaja aadida:
la particin de la tabla puede iniciarse por filas o por columnas (e igual con la
obtencin de los porcentajes), como se desee, pues la estructura del muestreo lo
permite (hay una nica muestra). Siendo esta es la nica diferencia prctica en-
tre ambos casos, es habitual que a una tabla procedente del caso de homogenei-
dad tambin se le llame tambin, por extensin, Tabla de Contingencia.

10.4.2 Caso particular de una tabla 22

A Cuando la tabla es 22 los clculos del actual test asinttico se simplifican


y/o requieren de un tratamiento especial. Desde un punto de vista condicionado
sigue siendo vlido todo lo indicado en 10.3.2.A. Desde un punto de vista in-
condicionado Martn and Tapia (2004) probaron que la c.p.c. ms adecuada es
26 BIOESTADSTICA

la de Pirie and Hamdan (1972), de modo que el test consistir en comparar:

O O 22 O12 O 21 0,5
2
11
=
2
C T con una 2 (1 g.l.) de la Tabla 7 (10.15)
F1F2 C1C2
con las matizaciones siguientes:
(a) Cuando el test es de una cola a la derecha (H1 La asociacin es positiva,
es decir un S a la caracterstica A tiende a venir acompaado de un S a la
caracterstica B, y similarmente con el NO) la comprobacin previa a reali-
zar es que O11O22O12O21 > 0 (por las razones que se vern ms tarde). El
test es vlido si E3,9 o si {T500 y E3} (Martn et al, 2004a);
(b) Cuando el test es de dos colas se aplica el criterio clsico de Armitage. El
test es vlido si E6,2 o si {T500 y E3,9} (Martn et al, 2004a).
(c) Si se desea ms precisin en la determinacin del valor P puede calcularse
zexp = C y utilizar las Tablas 1 o 2 en el sentido de siempre.
Ejemplo 10.5: En relacin con los datos de la Tabla 8.8(d): a) Son independientes las
respuestas al Centro de Salud y al Ambulatorio?; b) De no serlo, cul es
el tipo de asociacin existente?; c) Qu consecuencia puede extraerse
con respecto al diseo original de la experiencia en relacin con el obje-
tivo de la misma?
a) Como la nica muestra de T=125 individuos es clasificada segn la
opinin de los mismos acerca del Ambulatorio (caracterstica A, con r=2)
y el Centro de Salud (caracterstica B, con s=2), los datos toman la forma
de una Tabla de Contingencia 22 como la de este apartado (con las nij
de entonces lo que ahora llamamos Oij). Estn relacionadas las respues-
tas de los individuos al emitir su juicio sobre cada sistema? Para respon-
der a esto hay que contrastar H0 Las opiniones sobre el Centro de Sa-
lud y el Ambulatorio son independientes contra la alternativa de dos co-
las de que son dependientes. Como E = 6255/125 = 27,28 6,2 el test
asinttico (10.15) es vlido, y as:
27 20 35 43 0,5
2

C2 = 125 7,733 (1 g.l.)


62 63 70 55
con lo que 0,5%<P<1% por la Tabla 7. Si se desea ms precisin, zexp =
7, 733 = 2,78, de modo que 0,2%<P<1% por la Tabla 2 o P = 2
P(z2,78) = 2{1P(z2,78)} = 0,54% por la Tabla 1. En cualquier caso
el test es significativo.
b) Como hay evidencias de asociacin cabe preguntarse por el tipo de la
misma. Como el porcentaje de ses al Centro de Salud de entre los indi-
viduos que dicen S al Ambulatorio -(27/62)100 = 43,55%- es inferior
al de entre los que dicen NO al Ambulatorio -(43/63)100 = 68,25%- en-
tonces es ms probable decir S al Centro de Salud cuando se dijo NO al
Ambulatorio que cuando se dijo S. Como un S tiende a venir acompa-
ado de un NO, la asociacin es negativa (por una tendencia poltica, o
de otro tipo, a favor o en contra de lo nuevo). En la prxima seccin ve-
remos un procedimiento ms simple para deducir el tipo de asociacin.
c) El objetivo original del problema era comparar las proporciones de s-
es al Ambulatorio y al Centro de Salud. Para tal fin el investigador deci-
di planificar la experiencia como de muestras apareadas, pero a poste-
riori hemos visto que la asociacin es negativa, de modo que -por lo in-
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 27

dicado en el Captulo VIII- en el futuro es preferible planificar el expe-


rimento con muestras independientes.

Ver al final la Prctica de Ordenador D


B Acabamos de ver cmo los mismos datos -los de la Tabla 8.8(d)- pueden
sustentar dos preguntas distintas a las que, lgicamente, se responde tambin
con tcnicas distintas. A la pregunta son iguales los porcentajes de ses en los
dos sistemas de asistencia? -que es una comparacin de dos proporciones apa-
readas- se respondi en la seccin 8.9 obtenindose zexp=0,793 que, por no ser
significativa, indica que no hay evidencias de que un sistema sea preferido al
otro. A la pregunta son independientes las respuestas? -que es un test de inde-
pendencia de dos cualidades dicotmicas- se ha respondido en esta seccin ob-
tenindose que zexp=2,78 y que las respuestas estn asociadas negativamente.
Las cantidades experimentales de ambos tests son distintas, por lo que puede
suceder cualquier cosa: que ambos sean significativos, que ninguno lo sea o que
uno lo sea y el otro no. Algunos investigadores confunden el escenario e inten-
tan responder a la primera pregunta a travs del test 2 actual, lo que es un error.
Nuestro lector no debe equivocarse: el test 2 actual sirve para comparar dos
proporciones independientes (como se vio en la seccin anterior) pero no para
comparar dos proporciones apareadas.
Lo que acaba de ocurrir es un caso particular de algo ms general. La Tabla
8.8(d) proviene de la Tabla 8.8(b) que presenta los datos cualitativos dicotmi-
cos de dos muestras apareadas; la Tabla 8.2 presenta los datos cuantitativos de
dos muestras apareadas; la diferencia entre ambas es pues que en un caso se mi-
de una cualidad dicotmica y en el otro una cantidad. Ambas series de datos
admiten dos tipos de preguntas y, consiguientemente, dos anlisis estadsticos
distintos. Para el primer caso ya se ha visto que las preguntas son si las dos pro-
porciones de ses son iguales (test z) o si las respuestas estn asociadas (test 2);
para el segundo las preguntas son si las presiones medias antes y despus son
iguales (test t) o si las presiones antes y despus estn asociadas (que es un pro-
blema que se ver en el Captulo XIII). Las primeras preguntas de cada pareja
aluden a un test de comparacin de dos parmetros (proporciones o medias res-
pectivamente); las dos segundas aluden a un test de independencia (de datos
cualitativos o cuantitativos respectivamente). Y no deben confundirse. En los
dos casos la experiencia apareada ser preferible (con el objetivo de comparar
parmetros) si la asociacin es positiva, pero no si es nula o negativa.
Los datos de la Tabla 8.2 y las dos preguntas que sustentan quizs se en-
tiendan mejor si se los redefine. Si las parejas de nmeros de dicha tabla aluden
a la estatura de un padre y de su hijo primognito adulto, hay dos preguntas po-
sibles: son iguales las estaturas medias de padres e hijos? y la estatura de un
hijo es independiente de la de su padre? En el primer caso se comparan dos me-
dias apareadas; en el segundo se contrasta la asociacin entre los datos.

C En el prrafo A se ha visto la solucin asinttica al problema: 2Y ( C2 ) si


se emplea el mtodo condicionado (incondicionado). Al igual que en la seccin
anterior, y si se puede, debe emplearse la solucin exacta: el test exacto de Fis-
her (o de Barnard) si se emplea el mtodo condicionado (o el incondicionado).
El primero ya se vio en 8.8.1.1, pero el segundo no pues el mtodo de muestreo
es nuevo. El test de Barnard de 8.8.2.1 aluda al caso de dos distribuciones bi-
28 BIOESTADSTICA

nomiales independientes y era difcil de realizar incluso con un ordenador; el


test de Barnard actual alude al caso de una tetranomial (una multinomial con 4
clases) y es casi imposible de realizar con los ordenadores actuales. Al igual que
entonces el mtodo incondicionado proporciona tests ms potentes que el con-
dicionado, pero ello es a costa de un muchsimo superior esfuerzo de cmputo;
de hecho hoy da no es posible calcular el valor P incondicionado cuando n
100. Sin embargo, las diferencias entre ambas metodologas se amortiguan con-
forme aumenta el tamao de la muestra, de modo que para n100 los resultados
de ambas son similares (Martn et al, 2004b). El lector interesado puede obtener
el programa para el test de Barnard actual en http://www.ugr.es/local/bioest/
TMP.EXE. Alternativamente, y para pequeos tamaos de muestra, el test pue-
de efectuarse a travs de la Tabla 18 (tablas ms completas pueden encontrarse
en la direccin http://www.ugr.es/~bioest/crbind.pdf).

Ver al final la Prctica de Ordenador C


Para poder utilizar la Tabla 18, como indica su nota a pie de pgina, es pre-
ciso reordenar la tabla experimental de modo que suceda que:
n1 = Mn {a1; a2; n1; n2}, x1y2 < x2y1 (asociacin negativa)
pero para ello no es preciso reordenar la tabla de modo estricto, sino que basta
con anotar en ella quines son los valores clave: N, n1, x1 y x2 (obsrvese que a
estos efectos se est cambiando la notacin del captulo actual). Para ilustrarlo,
consideremos que los datos de la Tabla 8.6(b) ocupan las casillas correspon-
dientes en el experimento de la Tabla 8.8(d). Si el test es de una cola a la iz-
quierda (H1 Asociacin negativa O<1), como experimentalmente ocurre que
= 59/14 > 1 entonces el test no puede dar significativo y el problema fina-
O
liza. Si la alternativa fuera de una cola a la derecha (que es compatible con los
datos), o si el test es de dos colas, se procede como sigue (que N=19 es seguro):
1) Como Mn {6; 13; 9; 10} = 6, entonces n1=6 y n2=13 son las filas.
2) La pareja (x1; y2) puede ser la (5; 9) o la (1; 4), aquella que verifique la se-
gunda condicin: como 59>14 ser la segunda, y as x1=1 y x2=9.
3) Con todo ello los valores clave son N=19, n1=6, x1=1 y x2=9. Para ver la sig-
nificacin debe localizarse en la Tabla 18 la terna de nmeros (N=19; n1=6; y
x1=1), por ese orden, en la columna de UNA COLA (o de DOS COLAS); ella
proporciona los tres nmeros C=7, 8 y 11 (o C=8, 9, 11) correspondientes a
los errores del 10%, 5% y 1% respectivamente. Como la significacin se
obtiene cuando x2C y C5%=8 < x2=9 < C1%=11 ( o C5%=9 x2=9 < C1%=11)
el test es significativo para =5% y no lo es para =1%, es decir 1%<P<5%
(o 1%<P5%) lo que es compatible con el resultado exacto de P=1,65% (o
P=4,71%) obtenido por el programa aludido arriba. Obsrvese que ambos va-
lores son inferiores a los obtenidos por el test de Fisher (4,95% y 5,72%) o
por el de Barnard para el caso de dos proporciones (2,65% y 5,56%).
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 29

PRCTICAS DE ORDENADOR A
Realizar el Test Exacto de Fisher para la Tabla 8.6(b) que se reproduce abajo
mediante el programa http://www.langsrud.com/fisher.htm.

Mejora
Total
S NO
A (1) x1 = 5 1 = y1 n1 = 6
Frmaco
B (2) x2 = 4 9 = y2 n2 = 13
Total a1 = 9 10 = a2 N = 19

Ntese que los datos indican una asociacin positiva: 59 > 14.
http://www.langsrud.com/fisher.htm Introducir datos Compute se
obtienen las salidas:
Left: p-value = 0.9969 (alternativa de asociacin negativa: la opuesta
a la que indican los datos).
Right: p-value = 0.0495 (alternativa de asociacin positiva: la que in-
dican los datos).
2-Tail: p-value = 0.0573 (alternativa de dos colas).
NOTAS:
En el caso del test de una cola cualquier otro programa debe dar igual so-
lucin, pues hay un nico orden de entrada de los puntos en la RC.
En el caso del test de dos colas hay varios rdenes de entrada posibles
las soluciones de los diferentes programas pueden ser diferentes. El actual
programa utiliza el orden ptimo visto en clase: de menor a mayor proba-
bilidad.

PRCTICAS DE ORDENADOR B
Realizar el Test Exacto Incondicionado para la Tabla 8.6(b) que se reproduce
abajo mediante el programa SMP.EXE.

Mejora
Total
S NO
A (1) x1 = 5 1 = y1 n1 = 6
Frmaco
B (2) x2 = 4 9 = y2 n2 = 13
Total a1 = 9 10 = a2 N = 19

Ntese que los datos indican una asociacin positiva (59 > 14):
30 BIOESTADSTICA

Meter tabla orden B (el ptimo) 2 colas P = 0,05558 (0,02653 el


de una cola a la derecha).
Si no fuera posible el orden B por causa del tamao muestral (no es el ca-
so actual) se usa el B o el FM en funcin de las selecciones de la cartu-
la.
Si tampoco fueran posibles B o FM se utiliza el Test Exacto de Fisher.

PRCTICAS DE ORDENADOR C
Realizar el Test Exacto Incondicionado para la tabla que se reproduce abajo
mediante el programa TMP.EXE. La tabla ha sido obtenida tomando 19 indivi-
duos al azar y clasificndolos en base a las caractersticas reseadas. El obje-
tivo es contrastar la independencia de ambas caractersticas (Fumar y presen-
cia de Cardiopata)

Cardiopata
Total
S NO
S 5 1 6
Fumar
NO 4 9 13
Total 9 10 19

Ntese que los datos indican una asociacin positiva (59 > 14):
Meter tabla orden B (el ptimo) 2 colas P = 0,04711 (0,01652 en
el test de una cola a la derecha).
Si no fuera posible el orden B por causa del tamao muestral (no es el ca-
so actual) se usa el B o, si tampoco es posible, el FM (por las selecciones
de la cartula).
Si tampoco fuera posible el orden FM, se utiliza el programa SMP.EXE
asumiendo que las filas estn fijadas -lo que da P (n1 fijo)-, que las co-
lumnas estn fijadas -lo que da P (a1 fijo)- y haciendo que el valor P ac-
tual sea P = Mx {P (n1 fijo); P (a1 fijo)}.
Si tampoco fuera posible aplicar el programa SMP.EXE, se utiliza el test
exacto de Fisher.

PRCTICAS DE ORDENADOR D
Realizar el test asinttico chi-cuadrado para el ejemplo de la tabla de abajo
para todos los modelo (todos los totales fijados, totales de fila fijados, totales
de columna fijados y solo el total de 150 est fijado) y todos los tipos de test
(una o dos colas) utilizando el programa Z_INDEP.EXE.
Los tres test asintticos de tipo chi-cuadrado (condicionado, incondicionado para
contrastar la homogeneidad de dos proporciones independientes e incondiciona-
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 31

do para contrastar la independencia de dos cualidades dicotmicas) se pueden


obtener con el programa http://www.ugr.es/local/bioest/Z_INDEP.EXE. La
ventaja del programa es que el mismo proporciona las verdaderas condiciones
de validez de cada caso, pues las proporcionadas en el texto anterior son unas
cdv conservadoras (lo que ha venido obligado por el hecho de tener que indi-
car un nico nmero para todas las situaciones). Las soluciones que siguen
pueden diferir levemente de las vistas anteriormente; la causa es que el valor
de la chi-cuadrado experimental se ha definido hasta ahora con un factor mul-
tiplicador T, en tanto que el programa utiliza el factor ms apropiado (T1).
Tras introducir los datos se obtienen las salidas que siguen comentadas en cursiva :
Fuma
Muerte S NO Totales

Antes 60 20 80
Despus 40 30 70
Totales 100 50 150

TABLE: 60 20 | 80 E=23.3 = minima cantidad esperada de


40 30 | 70 la tabla que sirve para
----------------------- verificar las cdv de cada test
100 50 | 150

TWO-TAILED TEST
MARGINAL FIXED | CHI-SQUARE | P-VALUE(%) | VALID IF E>E*:
cdv del test
--------------------------------------------------------------------
Rows and Column (1) Yates=4.584 (2) 2.50 (4) E*=0.0 (5)
(n1,n2,a1,a2) Mantel=5.628 for x1=46 (3)
(1) Indica que se asume que todos los marginales estn fijados.
(2) Chi-cuadrado de Yates para la tabla original.
(3) Chi-cuadrado de Yates para la tabla de la otra cola (que es la de x1 = 46).
(4) p-value asinttico del procedimiento (similarmente en lo que sigue).
(5) El test es vlido pues E = 23.3 > E* = 0 (similarmente en lo que sigue).
--------------------------------------------------------------------
Rows (n1,n2) (6) Martn et al.=5.311 (7) 2.12 E*=5.6
Column (a1,a2) (8) Martn et al.=5.311 2.12 E*=5.3
(6) Se asume que los tamaos de muestra son los totales de fila.
(7) p-value del modelo asumido (similarmente en lo que sigue).
(8) Se asume que los tamaos de muestra son los totales de columna.
--------------------------------------------------------------------
32 BIOESTADSTICA

None (only n) (9) Pirie and Hamdan=5.316 2.11 E*=2.8


(9) Se asume el nico valor fijado es 150.
--------------------------------------------------------------------
ONE-TAILED TEST (Alternative hypothesis: Association Positive): resulta-
dos en el mismo sentido que antes, pero para el test de una cola a la derecha
(asociacin positiva que indican los datos).
MARGINAL FIXED | CHI-SQUARE | P-VALUE(%) | VALID IF E>E*
--------------------------------------------------------------------
Rows and Column Yates=4.584 1.61 E*=3.3
(n1,n2,a1,a2) Conover(1)=4.614 1.59 E*=2.8
--------------------------------------------------------------------
Rows (n1,n2) Martn et al.=5.311 1.06 E*=3.7
Column (a1,a2) Martn et al.=5.311 1.06 E*=4.0
--------------------------------------------------------------------
None (only n) Pirie and Hamdan=5.316 1.06 E*=2.8
--------------------------------------------------------------------
(1)Conover is better of Yates
ONE-TAILED TEST (Alternative hypothesis: Association Negative): resulta-
dos en el mismo sentido que antes, pero para el test de una cola a la izquierda
(asociacin negativa que no indican los datos). En el ejemplo no tiene inters
pues el test seguro que no va a dar significativo.
MARGINAL FIXED | CHI-SQUARE | P-VALUE(%) | VALID IF E>E*
--------------------------------------------------------------------
Rows and Column Yates=6.191 99.36 E*=3.3
(n1,n2,a1,a2) Conover(1)=6.221 99.37 E*=2.8
--------------------------------------------------------------------
Rows (n1,n2) Martn et al.=5.332 98.95 E*=3.7
Column (a1,a2) Martn et al.=5.332 98.95 E*=4.0
--------------------------------------------------------------------
None (only n) Pirie and Hamdan=5.327 98.95 E*=2.8
--------------------------------------------------------------------
(1)Conover is better of Yates

También podría gustarte