Documentos de Académico
Documentos de Profesional
Documentos de Cultura
5.3.9 Mtodo general para obtener intervalos de confianza exactos con variables
discretas
El modo general de obtener un intervalo de confianza exacto de dos colas (1; 2)
para el parmetro de una v.a. discreta x que puede tomar los valores x = 0, 1, 2, ..., en
base a un valor observado x=K, consiste en calcular el ms pequeo (1) y el ms gran-
de (2) valor de que verifican, respectivamente, las ecuaciones:
P(x K) = /2, P(x K) = /2 (5.27)
lo que se conoce como el mtodo de Clooper-Pearson. Obviamente, cuando el intervalo
es de una cola en la expresin anterior hay que acoger solo uno de los valores (1 para
el intervalo 1; 2 para el intervalo 2) y cambiar /2 por . En realidad el prin-
cipio es similar para los intervalos asintticos y para las variables continuas.
Como se ve, el asunto es laborioso, pero en ocasiones se simplifica. Por ejemplo, si
x=0 en el caso de una P(), entonces la primera sumatoria es seguro la unidad, y el va-
lor 1 no existe o, ms correctamente, 1=0 (lo mnimo posible).
6.9 TESTS DE HIPTESIS E INTERVALOS DE CONFIANZA
An cuando el procedimiento de test y el procedimiento de intervalos persiguen fi-
nes distintos, existe una ntima relacin entre ambos. En la seccin 6.6 ya se puso de
manifiesto la utilidad de los intervalos de confianza para matizar las conclusiones de un
test de hiptesis. Pero ahora iremos ms all.
6.9.1 Test a travs de intervalos
Hasta ahora se ha descrito un procedimiento para realizar un test que est basado
en los intervalos de aceptacin: se plantean las hiptesis (H0 p=0,5 vs. H1 p>0,5), se
elige un error (5%), se elige un estadstico (el nmero x de caras), se obtiene bajo H0
un intervalo de aceptacin para l (x7) y, finalmente, se comprueba si el valor muestral
obtenido cae dentro del mismo (y se concluye H0) o no (y se concluye H1).
Alternativamente, tambin puede realizarse un test de hiptesis a partir de un inter-
valo de confianza. Para contrastar H0 p=0,5 vs. H1 p0,5 en base a que para n=10 se
obtuvieron x=9 caras, por la frmula del intervalo exacto para una proporcin -expre-
sin (5.18)- se obtiene que p (55,50%; 99,75%) al 95% de confianza. Como p=50%
(la hiptesis nula) no es uno de los valores posibles de p (segn el intervalo) debemos
concluir que H0 es falsa para un error del 5% (el del intervalo). Por el contrario, si el
resultado hubiera sido x=7 el intervalo sera p (34,75%; 93,33%) y, como p=50% es
2 BIOESTADSTICA
uno de tales valores, no podemos rechazar H0 y deber aceptrsela (al error =5%). Ob-
srvese que en este ltimo caso el intervalo obtenido no slo permite aceptar H0
p=50%, sino tambin H0 p=60% o H0 p=70% etc, y es claro que el verdadero valor
de p slo puede ser uno de ellos. Esto ilustra una vez ms, y quizs ms claramente aho-
ra, que las aceptaciones de H0 no son de fiar.
El nuevo procedimiento de realizar un test de hiptesis en base al intervalo de con-
fianza para el parmetro objeto de estudio, es una alternativa al procedimiento clsico
basado en el intervalo de aceptacin para el estadstico de contraste. Ambos mtodos no
son en general equivalentes, siendo preferible (por razones de potencia) el clsico. La
no equivalencia de los dos procedimientos puede ocasionar resultados aparentemente
incompatibles y de difcil interpretacin. Por ejemplo, si en el caso de la moneda se ob-
tiene significacin (p50%) al error del 5% y, al intentar matizar el resultado se obtiene
un intervalo de confianza para p (tambin al error del 5%) que contiene al 50%, el resul-
tado es paradjico, pero debe aceptarse. Lo que sucede es que el test se ha obtenido por
un procedimiento (ms potente) y el intervalo por otro. Para que ello no ocurra ambas
metodologas (la de los tests y la de los intervalos) deben ser compatibles, lo que nos
lleva al siguiente apartado.
6.9.2 Intervalo a travs de tests
A En el apartado 5.3.9 se habl del mtodo general para obtener un intervalo de con-
fianza para un parmetro. As, la expresin (5.27), adaptada al caso actual de una pro-
porcin p, indica que el intervalo de confianza de dos colas (p1; p2) para p viene dado
por aquellos valores p1<p2 tales que P(xrp1) = P(xrp2) = /2, con r el valor obser-
vado de x. Ntese que esas probabilidades son, respectivamente, el valor P para el resul-
tado experimental r en el test de H0 p=p1 vs. H1 p>p1 y en el test de H0 p=p2 vs. H1
p<p2, lo que lleva a concluir que se puede construir un intervalo de confianza median-
te la inversin de dos tests de hiptesis de una cola. Es por ello que podemos afirmar
que un intervalo de confianza de dos colas (p1; p2) al error para p se obtiene as:
p1 (p2) es tal que el valor P del test para H1 p>p1 (H1 p<p2) es /2 (6.5)
lo que es conocido como el mtodo TOST (Two One Sided Test). La ventaja del mtodo
TOST, al utilizarlo como medio para obtener un intervalo de confianza de una cola, es
que los resultados obtenidos por el test y los obtenidos por el intervalo son compatibles.
Para el caso de dos colas sucede igual solo si la variable tiene una distribucin simtrica
o si como criterio para el test de dos colas se utiliza el de doblar el P (ver apartado
6.7.2); en otro caso (que es lo ms frecuente) es mejor proceder como sigue.
B Agresti and Min (2001) probaron que el mtodo de (6.5) proporciona intervalos de
confianza de dos colas ms amplios (y por tanto peores) que el que sigue. El argumento
es invertir dos tests de dos colas (mtodo TTST: Two Two Sided Tests) ms que dos
tests de una cola, y as:
p1 y p2 son tales que el valor P del test para H1ppi es (6.6)
con lo que las conclusiones del test y del intervalo ya s son compatibles. El problema
para que no se haga as en esta obra, ni en la literatura general, es que las expresiones
anteriores requieren normalmente de un gran esfuerzo de cmputo. Por ello, circunstan-
cialmente, en este libro puede presentarse la incompatibilidad conceptual antes indicada.
Anteriormente se han visto dos tests de dos colas basados en que la v.a.
original es discreta (Binomial o Poisson) y se aproxima a una v.a. continua (la
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 3
Normal). En todos los casos se ha calculado el valor P como el doble del valor P
del test de una cola (criterio de Armitage), lo cual es aparentemente apropiado
dado que la Normal es simtrica. El procedimiento ser apropiado cuando la
v.a. original sea simtrica respecto de su media (como en el Ejemplo 7.10 en el
que la Binomial con p=0,5 s es simtrica), pero no en otro caso. Desgraciada-
mente la literatura siempre lo hace as (quizs por la comodidad de los clcu-
los). El modo real de resolver el test se ilustra a continuacin con el caso de la
Poisson, pero el argumento es similar en todos los dems casos. El procedi-
miento (o criterio de Mantel) fue descrito por Mantel (1974) en el contexto de
las tablas 22, pero es de aplicacin general. Dado que el valor P por el criterio
de Armitage es siempre mayor o igual que el obtenido por el criterio de Mantel,
el primer test ser siempre conservador; de ah que si el mtodo clsico da signi-
ficativo, el que sigue tambin lo dar (y, por tanto, puede omitirse).
Consideremos el caso de tener que contrastar H0 =15,4 vs. H1 15,4
en base a una observacin x=23. Como 15,4>10, la aproximacin Normal es v-
lida. La solucin clsica de la (7.18) indica que zexp = (2315,40,5)/ 15, 4
= 1,81, por lo que P7% por la Tabla 2 o ms precisamente, P = 2 [1P(z
1,81)] = 7,02% por la Tabla 1. Veamos cmo obtener la solucin real:
1) Como x=23 > 0=0=15,4, la cola de error por la derecha ser P2 =
P(zzexp=1,81) = 1P(z1,81) = 3,51% por la Tabla 1;
2) Para obtener la cola de error por la izquierda es preciso determinar primero
el valor x de la otra cola que es tan distante o ms de 0 que x=23. Es
fcil ver que l ser x = [20x], con [t] aludiendo a que t debe redonde-
arse en el primer nmero entero lcito (en el sentido de alejarse de 0). Por
ello x = [215,4 23] = [7,8] = 7 (para as alejarse de 15,4). A dicho va-
lor (7) se le realizan los mismos clculos que antes: zexp= (715,40,5)/
15, 4 = 2,01 y P1 (el error de la cola izquierda) = P(z zexp=2,01) = 1
P(z2,01) = 2,22% por la Tabla 1;
3) Finalmente, y al igual que se procede con el mtodo exacto, P = P1+P2 =
3,51%+2,22% = 5,73%, valor menor o igual (siempre suceder as) que el
7,02% del mtodo clsico.
Los problemas de este tipo son los ms frecuentes en las Ciencias de la Sa-
lud; de ah que en esta seccin los veamos con bastante detalle. De un modo ge-
neral se trata de contrastar H0 p1=p2 contra H1 p1p2 en base a las dos v.a.
binomiales independientes x1 B(n1; p1) y x2B(n2; p2), de las que se ha toma-
do una observacin a la que tambin llamaremos por x1 y x2 respectivamente.
En general xi = nmero de individuos de entre los ni que presentan una carac-
terstica, siendo 100pi el porcentaje de individuos de la poblacin i que la pre-
sentan. A efectos prcticos conviene poner los datos en el formato de una Tabla
22 como la Tabla 8.6(a). Para realizar el test puede adoptarse una filosofa
condicionada o una incondicionada (recordar lo indicado en 8.7.1.1A), siendo
ahora x1+x2 el estadstico auxiliar sobre el que se condiciona (el que ha de man-
tenerse constante en toda la inferencia). Ahora le prestaremos atencin a ambas
filosofas pues los mtodos estn bien desarrollados y el problema es de especial
relevancia en casi todos los mbitos.
Tabla 8.6
(a) Presentacin general de los datos de una (b) Presentacin de los datos de la expe-
experiencia para comparar dos proporciones riencia del Ejemplo 8.10 en el formato de
independientes. la tabla (a).
Caracterstica Mejora
S NO Totales S NO Totales
Muestras Frmaco
I x1 y1 n1 A 5 1 6
II x2 y2 n2 B 4 9 13
Totales a1 a2 N Totales 9 10 19
totales de la Tabla 8.6 quedan fijos para el resto del problema. De hacerlo as, la
nica variable es x1 (por ejemplo), pues las dems pueden obtenerse restando x1
de los totales: x2 = a1x1, y1 = n1x1 e y2 = n2x2 = n2a1+x1. Cuando H0 es cierta
sucede que xiB(ni; p), de modo que P(x1a1) = P(x1)P(x2)/P(a1) por la defini-
cin de probabilidad condicionada. Como x1 y x2 son independientes, entonces
a1 = x1+x2 B(N=n1+n2; p) -por la (4.33)- de modo que sustituyendo arriba ca-
da probabilidad por su valor (4.29) puede verse que (x1a1) H(N; a1; n1) y as
sus probabilidades se obtienen como en la (4.48). Omitiendo el condicionante
(para mayor simplicidad de escritura) se ha visto que bajo Ho:
n1 n 2
x x n !n !a !a !
P(x1)= 1 2 = 1 2 1 2 , r=Mx (0; n1a2)x1s=Mn (a1; n1)(8.49)
N x1 !x 2 !y1 !y 2 !N!
a
1
expresin que, al no depender de parmetro desconocido alguno, permite calcu-
lar la probabilidad de la tabla. Una vez identificada la v.a. x1 que sirve de es-
tadstico de contraste, y su distribucin P(x1) bajo H0, el modo de proceder ser
el clsico de todo test de hiptesis (recordar el Captulo VI y, en particular, el
apartado 6.7.2): obtener la probabilidad de la muestra obtenida, o de una ms
extraa, y decidir en funcin del valor que se obtenga. Esto nos lleva a efectuar
los siguientes pasos.
Tabla 8.7
Valores posibles de x1, tablas 22 que los originan y probabilidades de las mismas para los
marginales de la Tabla 8.6(b).
x1 = 6 x1 = 5 x1 = 1 x1 = 0
6 0 6 5 1 6 1 5 6 0 6 6
3 10 13 4 9 13 8 5 13 9 4 13
9 10 19 9 10 19 9 10 19 9 10 19
P(6)=0,00309598 P(5)=0,04643963 P(1)=0,08359133 P(0)=0,00773994
1) Primero hay que determinar los valores posibles de la v.a. x1, es decir su es-
pacio muestral. Para los datos de la Tabla 8.6(b) la variable x1 puede tomar
los valores Mx (0; 610=4)=0 x1 Mn (9; 6)=6, es decir 0 x1 6. Ca-
da valor lcito de x1 proporciona una tabla 22 (cuyos valores se obtienen por
resta de los marginales): en la Tabla 8.7 se indican algunos valores de x1 y las
Tablas 22 que originan.
2) A continuacin hay que determinar la media de la v.a. Hipergeomtrica x1: 0
= n1a1/N = 69/19 = 2,84. Esto nos permite saber que el resultado observado
se encuentra a la derecha de la media -pues x1=5 > 0=2,84- de modo que si
el test es de una cola para la alternativa H1 p1<p2, como el resultado obser-
vado est en contradiccin con ello, entonces debe aceptarse H0 (su valor P
va a ser muy grande). Por el contrario, si la alternativa es H1 p1>p2, enton-
ces el valor P para ella ser P = P(x15) = P(5)+P(6).
3) Para obtener tales probabilidades hay que aplicar la (8.49):
6!13!9!10! 6!13!9!10!
P(6) = = 0,00309598 , P(5) = = 0,04643963
6!0!3!10!19! 5!1!4!9!19!
aunque en el proceso de clculo conviene eliminar el mximo nmero de
6 BIOESTADSTICA
trminos en cada ocasin; por ejemplo, en P(6) conviene eliminar los valores
6! y 10! del numerador y del denominador y simplificar el 13! del numerador
con el 19! del denominador, quedando en este ltimo como 1918 ... 14,
etc. En realidad cada probabilidad est relacionada con la anterior (por contar
con trminos en comn) y por ello interesa utilizar esta frmula recurrente:
x1 y2
P(x1 1) = P(x1 ) (descendente) (8.50)
(x 2 1)(y1 1)
Por ejemplo: P(5) = P(6)610/41, que da igual resultado que antes (por ra-
zones de precisin conviene mantener en los clculos un gran nmero de de-
cimales). Con ello P = P(5)+P(6) = 4,95% en el test de una cola para H1
p1>p2 y el problema finaliza: el test es significativo. Cuando el test es de dos
colas (como en nuestro ejemplo) el valor anterior es la probabilidad de una de
las colas (P1=4,95%) y hay que aplicar el cuarto paso que sigue.
4) Para determinar el valor P2 de la otra cola lo primero es saber donde comien-
za la misma, lo que implica calcular las probabilidades de los valores x1=0,
x1=1 etc. Con tal fin se procede como en el paso anterior, pero ahora la fr-
mula recurrente es la siguiente:
x 2 y1
P(x1 1) = P(x1 ) (ascendente) (8.51)
(x1 1)(y2 1)
En la misma Tabla 8.7 se indican las probabilidades de todos los x1 relevan-
tes al problema. Como P(0)P(5) y P(1)>P(5) entonces por la otra cola el va-
lor tan improbable o ms que el observado (el 5) es el 0. De ah que el valor P
de la otra cola sea P2 = P(x0) = P(x=0) = 0,77% y, finalmente, el valor P del
test de dos colas ser P = P1+P2 = 4,95%+0,77% = 5,72%: el test no llega a
ser significativo, pero hay indicios muy fuertes de que el frmaco A es mejor
que el B (pues p 1 =83,33% > p 2 =30,77%).
Cuando n1=n2 o a1=a2 la distribucin Hipergeomtrica es simtrica y el test
de dos colas anterior se simplifica: P = 2P1, es decir el valor P en el test de dos
colas es el doble del de una cola en la direccin apropiada (ver Ejemplo 8.11).
B Como se ha visto, el test exacto de Fisher es laborioso en sus clculos,
siendo especialmente conveniente disponer de unas tablas que los eviten. La
construccin de las mismas es dificultosa por cuanto la Hipergeomtrica depen-
de de tres parmetros (N, a1 y n1) y de una v.a. (x1), lo que hace que las tablas
sean demasiado extensas. La Tabla 16 es un ejemplo muy reducido de ellas; ta-
blas ms completas (y en el mismo formato) pueden encontrarse en la direccin
http://www.ugr.es/~bioest/crfisher.pdf. Dicha Tabla, como indica su nota a pi
de pgina, est construida de un modo muy especial tendente a ahorrar espacio.
La razn de ello es que como en la Hipergeomtrica no hay por qu distinguir
entre filas y columnas, las ocho tablas que se obtendran permutando las dos fi-
las de la Tabla 8.6, sus dos columnas o sus filas por columnas, slo es preciso
anotarlas una vez. Por tanto para resolver un problema lo primero es reordenar
la tabla experimental de modo que suceda que:
a1 = Mn {a1; a2; n1; n2} y p 1 = x1 / n1 < p 2 = x 2 / n 2
pero para ello no es preciso reordenar la tabla de modo estricto, sino que basta
con anotar en ella quines son los valores clave: x1, n1, a1 y N. Veamos el modo
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 7
de actuar (para todos los tests posibles) en base a los datos de la Tabla 8.6(b).
Si la alternativa es H1 p1<p2, la Tabla 8.6(b) no requiere ser reordenada
pues, siendo p 1 =83,33% > p 2 =30,77% contrario a H1, la conclusin es direc-
tamente H0. Si la alternativa fuera H1 p1>p2 tiene sentido realizar el test, por lo
que s es preciso reordenar la Tabla 8.6(b). Para ello se actuar as:
1) Al total se le llama N (N=19). En esto no hay duda;
2) Al marginal ms pequeo (de entre 6, 13, 9 y 10) se le llama a1 (a1=6).
3) De los dos nmeros que proporcionan a1 (5 y 1), uno ser x1 y el otro x2. De
los dos marginales opuestos al a1 (9 y 10), uno ser n1 y otro n2. Para decidir
quin es quin, hay que aplicar la segunda condicin de arriba: x1 es el que da
una proporcin ms pequea. Como 5/9 > 1/10, ser x1=1.
4) El valor n1 es el que sirvi de denominador a x1, de modo que n1=10.
Con todo ello los valores clave son N=19, a1=6, n1=10 y x1=1. Para ver la signi-
ficacin debe localizarse en la Tabla 16 la terna de nmeros (N=19; a1=6; x1=1),
por ese orden, en la columna de UNA COLA; ella proporciona los tres nmeros
C= 9, 10 y 12 correspondientes a los errores del 10%, 5% y 1% respectiva-
mente. Como C5%=10 n1=10 < C1%=12, el test es significativo para =5% y
no lo es para =1%, es decir 1%<P5% (lo que es compatible con el resultado
exacto de P=4,95%: aunque esto no suceder siempre pues la Tabla 16 est
construida por un mtodo ptimo distinto del descrito en el prrafo A).
Para el test de dos colas se procede como en el caso anterior, pero mirando
en la columna de DOS COLAS de la Tabla 16. Ahora C=10, 11 y 12 de modo
que 5%<P10% (lo que es compatible con el resultado exacto de P=5,72%). Pa-
ra ilustrar otros casos no vistos, supongamos que para la misma terna y caso an-
terior el valor de n1 fuera 9: como n1=9 < C10%=10, entonces P>10% y el test no
sera significativo. Finalmente, cuando en la Tabla 16 aparece C=-- ello indica
que para esos datos nunca se puede obtener significacin a los errores indica-
dos (con lo que P>10% seguro).
Ver al final la Prctica de Ordenador A
C Si el valor de P(x1a1) = P(x1)P(x2)/P(a1) del prrafo A no se obtiene bajo
H0, sino en los valores originales de p1 y p2, puede demostrarse que entonces la
distribucin condicionada es:
n1 n 2 x1
x x
P x1 s 1 2 (8.52)
n1 n 2 h
h r h a1 h
en donde r y s aluden a los lmites indicados en la expresin (8.49) y = p1q2/
p2q1, que es el parmetro natural del modelo condicionado, ser aludido en el
Captulo X como la razn del producto cruzado. Es posible (aunque numrica-
mente complicado) determinar el intervalo de confianza exacto para el parme-
tro , pero no para otros parmetros de inters como p1p2 pues el modelo con-
dicionado lo prohbe; no ocurre as con el mtodo incondicionado (como se ve
ms tarde).
Otro aspecto de la cuestin es la determinacin exacta del tamao de mues-
tra. Una vez ms el modelo condicionado lo impide (pues no hay modo de saber
8 BIOESTADSTICA
Realizando operaciones puede verse que la zexp anterior da igual valor que la se-
gunda expresin de (8.53); de hecho, el mismo razonamiento anterior puede lle-
var a una zexp igual a la de la primera expresin de (8.53) si en lugar de sustituir
p por su estimador insesgado p , se sustituye pq por su estimador insesgado pq .
El test anterior es doblemente aproximado (pues l usa la aproximacin de la
Binomial a la Normal y sustituye p por una estimacin) y, sin embargo, en la
prctica se comporta bastante bien.
Para test de una cola a la derecha (H1 p1>p2) la comprobacin previa a
realizar es que p 1 p 2 . Para el test de dos colas es ms potente aplicar el crite-
rio de Mantel de la seccin 7.5, en donde la variable es x1 y la media es 0 =
a1n1/N como se vio en el test exacto de Fisher (al cual intenta aproximar el ac-
tual). En todo caso la (8.56) ha de entenderse en el sentido de la (7.12).
En cuanto a las condiciones de validez del test lo tradicional es admitir las
clsicas enunciadas hasta ahora: el test ser vlido si las cantidades n1 p , n2 p ,
n1 p y n2 p son mayores que 5 (para que las Binomiales se aproximen a la Nor-
mal). Esto es equivalente a comprobar la siguiente nica condicin -que resume
a las cuatro anteriores por tomar la ms desfavorable de ellas- y que es la misma
que se enunci para la (8.53): el test es vlido si E>5, con:
Min (a1 ; a 2 ) Min (n1 ; n 2 )
E= (8.57)
N
en donde E, por razones que se vern en el Captulo X, es conocida como la m-
nima cantidad esperada. Desgraciadamente la condicin de validez anterior, a
pesar de ser la clsica de la literatura, no es muy adecuada pues solo es vlida si
los marginales son pequeos y equilibrados (Martn and Herranz, 2000). Martn
et al (2004a) justifican terica y prcticamente que la condicin de validez real
es E>0 para el test de dos colas (lo que implica que siempre es vlido), pero pa-
ra una cola ha de ser E20,7 (aunque si N500 basta con E8,8).
10 BIOESTADSTICA
Ejemplos 8.10 y 8.11 (continuacin): Como ambos tests son de dos colas no es preciso
comprobar la condicin de validez (bajo la condicin clsica ninguno de los
dos casos puede resolverse por el test asinttico, pues E = 69/19 = 2,8 5
y E = 404/80 = 2 5). Aplicando la (8.56) a la Tabla 8.6(b):
5 4 19
6 13 2 6 13
zexp = = 1,64
9 10 19
19 19 6 13
y el mtodo clsico (y errneo) indica que 10%<P<11% al comparar zexp=
1,64 con la Tabla 2: el resultado es muy discrepante con el valor exacto de
P=5,72%. La razn de ello es que no se ha aplicado el siguiente criterio co-
rrecto de Mantel: 1) Como x1=5 > 0=69/19=2,8, entonces P1 = P(z1,64)
= 5,05% por la Tabla 1; 2) x1 = [22,85] = [0,6] = 0, valor que se corres-
ponde con la ltima tabla de la Tabla 8.7 y al que hay que aplicarle de nue-
vo la (8.56):
0 9 19
6 13 2 6 13
zexp = = 2,32
9 10 19
19 19 6 13
Con ello P2 = P(z2,32) = 1,02%; 3) Finalmente P = 5,05%+1,02% =
6,07%, valor prcticamente igual que el exacto de P=5,72%. Hacer bien las
cosas tiene su recompensa.
Procediendo de modo similar con los datos del Ejemplo 8.11 se obtie-
ne que zexp=1,54 y P = 26,18% = 12,36% por la Tabla 1 y por ambos pro-
cedimientos (el resultado es el mismo porque n1=n2 y la Hipergeomtrica es
simtrica) frente al valor exacto de 11,56%. El obtenido por la aproxima-
cin de Poisson (ver Ejemplo 8.11) fue ligeramente peor (12,5%), lo que es
un resultado general: si se puede, debe aplicarse la aproximacin Normal
antes que la aproximacin de Poisson.
Ver al final la Prcticas de Ordenador D
tremo superior del 100,4%, que debe redondearse al 100% (lo mximo permiti-
do). En segundo lugar se observa que el intervalo no contiene al 0, y sin embar-
go el test aproximado no dio significativo al error =5%: estas son las incon-
gruencias de las que se avisaron en el apartado 6.9.2.
Existen dos expresiones alternativas (y mejores) que la (8.58). La primera es muy
sencilla, se debe a Agresti and Caffo (2000): utilizar la (8.58) sin c.p.c. y con todos los
datos del interior de la tabla incrementados en z 2 / 4 (y, lgicamente, los del exterior
incrementados en z 2 / 2 ). El intervalo as obtenido, 6,06% p1p2 +90,07%, no pre-
senta ninguna de las desventajas del anterior y es ms cercano al intervalo exacto 1,7%
p1p2 79,3% de 8.13.4. La segunda, debida a Martn and Herranz (2003), es ms
complicada pero ms exacta. Ahora, de nuevo para =5%:
A=z 2 (n 2 n1 ) 2 n1n 2 +Nn1n 2
2 p
d=p 1 2
B B C
con B=z (n 2 n1 )(a 2 a1 ) 2Nn1n 2 (d c);
2
N (8.59)
2A 2A A c=
C=Nn1n 2 (d c) 2 z 2 a1a 2 2n1n 2
lo que proporciona el intervalo 7,85% p1p2 78,16%. Para grandes muestras, una
simplificacin de lo anterior es la expresin que sigue (que proporciona el intervalo
1,12% p1p2 93,65%) en la que c y d son como antes (cuando c=0, la expresin
que sigue es la misma de (8.58) sin la c.p.c. final):
a1a 2 (d c)(n 2 n1 )(a 2 a1 ) (d c) 2 (n 2 n1 ) 2 n1n 2
(d c) z
Nn1n 2
C En cuanto al tamao adecuado de muestra para que un test al error detec-
te una diferencia =p1p2 entre las dos proporciones el 100(1 )% de las
veces en que esta se produzca, hemos de considerar que por la (8.54), y asu-
miendo el diseo ptimo de n1=n2=n y que =p1p2, se obtiene que p 1 p 2
N{0; 2pq / n } bajo H0 y p 1 p 2 N{; (p1q1 p2 q 2 ) / n } bajo H1. La (7.10)
aplicada con estas expresiones proporciona la frmula deseada (cambiar por
2 si el test es de dos colas), en donde p = (p1+p2)/2, las z se miran en la Tabla
2 y la segunda expresin alude al valor de n para el test con c.p.c.:
2
z 2pq z2 p1q1 p2 q 2
2
n 4
n= , nC 1 1 (8.60)
4 n
Como las cantidades pi son desconocidas, debe sustiturselas por estimaciones
que hagan mxima la expresin anterior (para que as sobre muestra). Para ello:
1) Cuando no se tiene conocimiento alguno acerca de las pi, lo mejor es sustituir
(p1q1+p2q2) por lo mximo que pueda valer bajo la condicin =p1p2.
Puede demostrarse que el mximo se alcanza cuando las pi valen 0,5/2, y
as Mx (p1q1+p2q2) = (12)/2 y p=1/2. Sustituyendo arriba:
2
1 z z 2 1
2
en donde las ci aluden al costo de cada elemento de cada muestra. El valor mximo de
esa expresin (a aplicar cuando no se tiene informacin acerca de las pi) es:
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 13
2 2
t+1 4(t 3 1) 2 n 2 t 1
n1 = z z 2 1 , nC 1 1 1 (8.63)
4t2 (t 1) 3
4 tn1
en donde la segunda expresin, que se basa en el valor obtenido en la primera, alude al
tamao de muestra con c.p.c. As, para los datos del Ejemplo 8.12 con t=0,5 (los ele-
mentos de la segunda muestra cuestan 4 veces ms que los de la primera), p1=0,7 y
p2=0,8 se obtiene n1=350,99 (sin c.p.c.) y n1=380,4 (con c.p.c.). Por consiguiente,
n1=381 y n2 = 0,5381 = 191.
fiable pues E=2,8 < 7,7 y E=2 < 7,7 respectivamente. Si, por practicar, se
aplica la (8.65) a la Tabla 8.6(b):
5 4 1
6 13 6 13
zexp = = 2,08
9 10 19
19 19 6 13
lo que da 3%<P<4% al mirar en la Tabla 2 o P = 21,88% = 3,76% al hacerlo
en la Tabla 1: el resultado es moderadamente discrepante con el valor exacto de
P= 5,56%. Procediendo de modo similar con los datos del Ejemplo 8.11 se ob-
tiene que zexp=2,03 y P = 22,12% = 4,24% por la Tabla 1 (valor muy cercano
al exacto de 4,12%).
Ver al final la Prctica de Ordenador D
B El mismo argumento de antes es aplicable tambin al intervalo de confianza
para la diferencia de proporciones; la (8.58) es ahora:
p q p q 1/n n si n1 n 2
p1 p2 ( p 1 p 2 ) z 1 1 2 2 c , con c= 1 2 (8.66)
n1 n2 2/n1n 2 si n1 n 2
con las mismas condiciones de validez de entonces: x1, x2, y1, y2>5. Las expre-
siones (8.59) y siguiente son vlidas si en ellas se pone el actual valor de c.
C Finalmente, para el tamao de muestra son vlidas las expresiones (8.60) a
(8.63) sin necesidad de corregirlas por c.p.c., pues la nueva cantidad c le influye
de modo despreciable. Por ello ahora es vlida la solucin directa de n=231 del
Ejemplo 8.12.
nmero observado de individuos que caen en cada clase se le llama Oij (con i
aludiendo al nmero de fila y j al nmero de columna). As, O23=85 indica que
de entre los individuos que reciben el tratamiento 2 hay 85 que mejoran (y caen
en la columna 3). Sumando por columnas, Cj alude al total de individuos de la
columna j, y as C1=37 indica que empeoraron un total de 37. Obviamente C1+
C2+C3 = 560 = F1+F2+F3+F4 y T=560 es el gran total (nmero total de indivi-
duos que intervienen en la experiencia).
De modo general puede contarse con r muestras (tratamientos en nuestro
ejemplo) cuyos individuos se clasifican en s clases (grado de mejora en nuestro
ejemplo) dando lugar a una Tabla rs como la Tabla 10.5. En todo caso ser:
Oij = n de individuos en la fila i columna j;
Fi = jOij = total de la fila i = tamao de la muestra i;
Cj = iOij = total de la columna j = n total de individuos en la clase j;
T = i, jOij = iFi = jCj = gran total = n total de individuos.
Tabla 10.4
Clasificacin de 4 grupos de individuos segn su estado tras 4 tratamientos.
Oij Peor Igual Mejor Totales
Tratamiento 1 7 = O11 28 = O12 115 = O13 150 = F1
Tratamiento 2 15 = O21 20 = O22 85 = O23 120 = F2
Tratamiento 3 10 = O31 30 = O32 90 = O33 130 = F3
Tratamiento 4 5 = O41 40 = O42 115 = O43 160 = F4
Totales 37 = C1 118 = C2 405 = C3 560 = T
Para ilustrar el modo de calcular las cantidades esperadas Eij fijmonos por
ejemplo en el caso de E23: el nmero de individuos que, recibiendo el tratamien-
to 2, deberan de caer en promedio en la clase mejor si H0 fuera cierta. Si H0
es cierta la proporcin p3 de individuos que mejoran es desconocida, pero es es-
timable por p 3 = n total de mejorados / gran total = 405/560 = C3/T. Como el
tratamiento 2 fue aplicado a F2=120 enfermos, el nmero esperado de ellos que
mejoran ser E23 = F2 p 3 = F2C3/T = 405120/560 = 86,79. La regla general
es ya obvia:
Fi C j (Total de su fila) (Total de su columna)
E ij = = (10.8)
T Gran Total
y a partir de ella se construye la Tabla 10.6. En ella, los totales de fila y de co-
lumna coinciden con los de la Tabla 10.4 que la origin, lo que no es por azar
sino que es consecuencia de la definicin de las Eij: por ejemplo, para las filas,
jEij = j(FiCj)/T = (Fi/T)jCj = Fi (de igual modo con las columnas).
Tabla 10.6: Cantidades esperadas para los datos de la Tabla 10.4.
Eij Peor Igual Mejor Totales
Tratamiento 1 E11 = 9,91 E12 = 31,61 E13 = 108,48 F1 = 150
Tratamiento 2 E21 = 7,93 E22 = 25,28 E23 = 86,79 F2 = 120
Tratamiento 3 E31 = 8,59 E32 = 27,39 E33 = 94,02 F3 = 130
Tratamiento 4 E41 = 10,57 E42 = 33,72 E43 = 115,71 F4 = 160
Totales C1 = 37 C2 = 118 C3 = 405 T = 560
18 BIOESTADSTICA
Las condiciones de validez del test 2 son las de siempre; por ello en nues-
tro ejemplo el test que sigue es vlido pues todas las Eij son mayores que 5. Si
las condiciones de validez no se verificaran, el problema presenta complicacio-
nes y la mejor solucin es ampliar la muestra. Ahora, la solucin de juntar cla-
ses es problemtica dada la estructura de las Tablas rs: juntar dos filas implica
juntar dos tratamientos en uno slo (y no nos consta que sean iguales); juntar
dos columnas es juntar dos clases en una sola (y no nos consta que la significa-
cin no radique en una de ellas); juntar dos casillas contiguas individuales altera
la estructura del problema y requiere de mtodos especiales (ver Rao, 1970).
10.3.1.4 Obtencin de la cantidad experimental
O E ij
2
Oij2
E
ij
2
exp = = T (10.9)
i, j E ij i, j ij
A Cuando slo se dispone de dos muestras (r=2) cuyos individuos son clasi-
ficados en dos clases (s=2) se est en presencia de una tabla 22 y el problema
ya sabemos resolverlo por dos mtodos distintos: el de la seccin actual y el de
la seccin 8.8. Desde luego que es deseable que ambas tcnicas coincidan (para
que as los mtodos estadsticos sean coherentes) y en esencia esto es lo que su-
cede (con alguna matizacin que se ver). Para estudiar esto, la Tabla 10.11 pre-
senta en su parte (a) el formato de los datos con la notacin de un test 2 y en su
parte (b) el formato con la notacin del test de comparacin de dos proporciones
independientes. Entonces:
1) En el contexto actual, la hiptesis nula es que los porcentajes de ses (pi) son
el mismo en las dos poblaciones (H0 p1=p2) -y por tanto tambin los de no-
es-; ella es justamente la H0 del test de la seccin 8.8: las H0 coinciden;
2) Segn la regla de validez del Comentario 10.1, el test 2 es vlido si todas las
Eij = FiCj/T son mayores que 5 (pues en una tabla 22 sucede que K=4 y el
20% de 4 es inferior a l), lo que es equivalente a afirmar que lo sea la menor
de ellas (lo que se conoce como mnima cantidad esperada):
Min Fi Min C j
E= (10.11)
T
cantidad que coincide con la (8.57) si se tiene en cuenta el cambio de nota-
cin. Pero la condicin E>5 es tambin la clsica citada en 8.8.1.3, de modo
que las condiciones de validez clsicas tambin coinciden;
Tabla 10.11: Presentacin general de los datos de una Tabla 22.
(a) Como un test 2. (b) Como un test de comparacin de dos
proporciones independientes.
Clases Clases
S NO Totales S NO Totales
Muestras Muestras
1 O11 O12 F1 1 x1 y1 n1
2 O21 O22 F2 2 x2 y2 n2
Totales C1 C2 T Totales a1 a2 N
20 BIOESTADSTICA
exp
2
= T (10.12)
F1F2 C1C2
que, siendo equivalente a la (10.2), suele ser aludida como 2 sin c.p.c. o no
corregida por continuidad. La cantidad exp 2
est limitada en su utilizacin al
caso de las particiones de tablas -pues en ellas no hay que hacer c.p.c.- y al
caso del coeficiente phi que se ve ms adelante. En realidad, por el Comenta-
rio 10.2, la exp
2
debera llevar c.p.c. (pues K=4 4), de modo que procedien-
do igual con la (10.6) se obtiene la siguiente 2 de Yates:
2
T
O11O 22 O12 O 21
2Y =
2
T (10.13)
F1F2 C1C 2
Pero poniendo la (8.56) en los trminos actuales, y operando, es fcil ver que
2
z exp 2Y y as las cantidades experimentales de ambos tests son equivalen-
tes (e igual pasa con las cantidades experimentales sin c.p.c.);
4) Finalmente, la cantidad zexp de entonces haba que compararla con una z de
la Tabla 2, en tanto que la cantidad 2Y de ahora ha de compararse con una
2 (1 g.l.) de la Tabla 7 (pues al ser r=s=2 los g.l. sern (21)(21) = 1). Pe-
ro ya se ha dicho en otra ocasin que z 2 2 (1 g.l.) , y as las cantidades te-
ricas de ambos test tambin coinciden.
Como consecuencia de todo lo anterior, el anlisis asinttico clsico de
una tabla 22 puede abordarse indistintamente por la tcnica de 2 -expresin
(10.13)- o por la tcnica z del test condicionado de comparacin de dos propor-
ciones independientes -expresin (8.56)-, pues ambos tests son el mismo, siendo
la eleccin de uno u otro una cuestin de gustos (aunque si con posterioridad se
va a determinar el intervalo de confianza o el tamao de muestra, puede que se
prefiera el test z por ser aprovechables algunos de sus clculos). De hecho, co-
mo el mtodo actual es ms cmodo (pues requiere menos operaciones), pero
tambin es ms impreciso (pues la Tabla 7 es menos extensa que las Tablas 1 y
2), los investigadores suelen obtener ambas ventajas calculando 2Y , haciendo
zexp = Y y razonando ya en base a las Tablas 1 o 2 y a lo indicado en 8.8.1.3.
De lo anterior tambin se deduce que como el test de (8.56) es un test de
dos colas, asinttico, condicionado y aplicado en el sentido clsico de Armi-
tage, el test actual de la (10.13), que le es equivalente, tambin lo ser; de ah
que el test general de donde proviene tal expresin -el de (10.6)- tambin verifi-
ca todas esas caractersticas. Sin embargo, en una tabla 22 es factible mejorar
las cosas en base a lo indicado en 8.8.1.3; recopilando lo indicado all, se dedu-
ce que para aplicar el test de (10.13) hay que actuar as:
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 21
(a) Cuando el test es de una cola a la derecha (H1 p1>p2) la comprobacin pre-
via a realizar -antes de calcular el valor P por la Tabla 7 y dividirlo por 2- es
que p 1 =O11/F1 > p 2 =O21/F2. El test es vlido si E20,7 o si {T500 y
E8,8};
(b) Cuando el test es de dos colas (H1 p1p2) resulta ms potente aplicar el test
2Y con la precaucin de Mantel de la seccin 7.5, en donde la variable es
O11 con media 0 = F1C1/T (el test 2 del captulo actual se utiliza bajo el cri-
terio de Armitage pues con tablas superiores a 22 las diferencias son irre-
levantes). Ahora el test es siempre vlido (en contraste con la clsica condi-
cin de validez E>5 que utilizaremos solo para tablas superiores a 22);
(c) En todo caso la (10.13) ha de entenderse en el sentido de la expresin (7.12),
de modo que cuando O11O22O12O21 T/2 entonces 2Y =0 (lo que es
compatible con lo que se dijo para una tabla de orden superior a 22).
O O 22 O12 O 21 c
2
11 1 si n1 n 2
=
2
C T, con c= (10.14)
F1F2 C1C 2 2 si n1 n 2
que, siendo equivalente al estadstico incondicionado de la expresin (8.65), se
aplica con los criterios indicados en 8.8.2.2:
(a) Cuando el test es de una cola a la derecha (H1 p1>p2) la comprobacin pre-
via a realizar es que p 1 =O11/F1 > p 2 =O21/F2. El test es vlido si E14,8 o si
{N500 y E7,2};
(b) Cuando el test es de dos colas (H1 p1p2) se aplica el criterio clsico (el de
Armitage). El test es vlido si E14,9 o si {N500 y E7,7}
(c) En todo caso la (10.14) ha de entenderse en el sentido de la expresin (7.12),
de modo que cuando O11O22O12O21 c entonces C2 =0.
Y =
2 2
19 2, 686; C =
2
19 4,330
6 13 9 10 6 13 9 10
22 BIOESTADSTICA
2
19
0 4 69
Y2 =
2
19 5,360
6 13 9 10
con lo que zexp=2,32 como en el Captulo VIII.
Si se prefiere utilizar directamente la Tabla 7, en el caso incondicio-
nado el valor C2 =4,330 indica que 2,5%<P<5%, lo que concuerda (pero
es ms impreciso) con los valores 3%<P<4% y P=3,76% de la 8.8.2.2.
A En el ejemplo, los mismos 141 individuos han sido clasificados con arreglo
a dos caractersticas cualitativas (A Localizacin de tumor y B Naturale-
za del tumor), cada una de ellas con tres clases, siendo la notacin acerca de
las frecuencias obtenidas la misma de la seccin anterior. De un modo general
los T individuos de una nica muestra pueden ser clasificados con arreglo a dos
caractersticas cualitativas A y B, la primera de ellas con r clases y la segunda
con s clases, dando as lugar a una Tabla de Contingencia rs como la Tabla
10.13 (la tabla de ejemplo era 33).
Tabla 10.13
Clasificacin de los T individuos de una muestra con arreglo a los r niveles de una
caracterstica cualitativa A y a los s niveles de otra caracterstica cualitativa B.
B 1 2 j s Totales
A
1 O11 O12 O1j O1s F1
2 O21 O22 O2j O2s F2
i Oi1 Oi2 Oij Ois Fi
r Or1 Or2 Orj Ors Fr
Totales C1 C2 Cj Cs T
Puede notarse la gran similitud entre las Tablas 10.13 y 10.5 (de ah que se
mantenga la misma notacin). La diferencia entre una y otra es que aqu hay
una nica muestra clasificada segn dos caractersticas cualitativas, en tanto que
all haba r muestras clasificadas segn una caracterstica cualitativa. Como se
ver de inmediato, no slo son parecidas las tablas sino tambin el anlisis es-
tadstico de ambas (y ello a pesar de responder a preguntas distintas).
Tabla 10.14
Porcentajes por filas para los datos de la Tabla 10.12.
(% de tumores de cada tipo en cada zona cerebral)
Naturaleza
Benigno Maligno Otros Totales
Localizacin
Lbulo frontal 60,5 23,7 15,8 100%
Lbulo temporal 75,0 14,3 10,7 100%
Otras reas 45,3 32,0 22,7 100%
24 BIOESTADSTICA
O O 22 O12 O 21 0,5
2
11
=
2
C T con una 2 (1 g.l.) de la Tabla 7 (10.15)
F1F2 C1C2
con las matizaciones siguientes:
(a) Cuando el test es de una cola a la derecha (H1 La asociacin es positiva,
es decir un S a la caracterstica A tiende a venir acompaado de un S a la
caracterstica B, y similarmente con el NO) la comprobacin previa a reali-
zar es que O11O22O12O21 > 0 (por las razones que se vern ms tarde). El
test es vlido si E3,9 o si {T500 y E3} (Martn et al, 2004a);
(b) Cuando el test es de dos colas se aplica el criterio clsico de Armitage. El
test es vlido si E6,2 o si {T500 y E3,9} (Martn et al, 2004a).
(c) Si se desea ms precisin en la determinacin del valor P puede calcularse
zexp = C y utilizar las Tablas 1 o 2 en el sentido de siempre.
Ejemplo 10.5: En relacin con los datos de la Tabla 8.8(d): a) Son independientes las
respuestas al Centro de Salud y al Ambulatorio?; b) De no serlo, cul es
el tipo de asociacin existente?; c) Qu consecuencia puede extraerse
con respecto al diseo original de la experiencia en relacin con el obje-
tivo de la misma?
a) Como la nica muestra de T=125 individuos es clasificada segn la
opinin de los mismos acerca del Ambulatorio (caracterstica A, con r=2)
y el Centro de Salud (caracterstica B, con s=2), los datos toman la forma
de una Tabla de Contingencia 22 como la de este apartado (con las nij
de entonces lo que ahora llamamos Oij). Estn relacionadas las respues-
tas de los individuos al emitir su juicio sobre cada sistema? Para respon-
der a esto hay que contrastar H0 Las opiniones sobre el Centro de Sa-
lud y el Ambulatorio son independientes contra la alternativa de dos co-
las de que son dependientes. Como E = 6255/125 = 27,28 6,2 el test
asinttico (10.15) es vlido, y as:
27 20 35 43 0,5
2
PRCTICAS DE ORDENADOR A
Realizar el Test Exacto de Fisher para la Tabla 8.6(b) que se reproduce abajo
mediante el programa http://www.langsrud.com/fisher.htm.
Mejora
Total
S NO
A (1) x1 = 5 1 = y1 n1 = 6
Frmaco
B (2) x2 = 4 9 = y2 n2 = 13
Total a1 = 9 10 = a2 N = 19
Ntese que los datos indican una asociacin positiva: 59 > 14.
http://www.langsrud.com/fisher.htm Introducir datos Compute se
obtienen las salidas:
Left: p-value = 0.9969 (alternativa de asociacin negativa: la opuesta
a la que indican los datos).
Right: p-value = 0.0495 (alternativa de asociacin positiva: la que in-
dican los datos).
2-Tail: p-value = 0.0573 (alternativa de dos colas).
NOTAS:
En el caso del test de una cola cualquier otro programa debe dar igual so-
lucin, pues hay un nico orden de entrada de los puntos en la RC.
En el caso del test de dos colas hay varios rdenes de entrada posibles
las soluciones de los diferentes programas pueden ser diferentes. El actual
programa utiliza el orden ptimo visto en clase: de menor a mayor proba-
bilidad.
PRCTICAS DE ORDENADOR B
Realizar el Test Exacto Incondicionado para la Tabla 8.6(b) que se reproduce
abajo mediante el programa SMP.EXE.
Mejora
Total
S NO
A (1) x1 = 5 1 = y1 n1 = 6
Frmaco
B (2) x2 = 4 9 = y2 n2 = 13
Total a1 = 9 10 = a2 N = 19
Ntese que los datos indican una asociacin positiva (59 > 14):
30 BIOESTADSTICA
PRCTICAS DE ORDENADOR C
Realizar el Test Exacto Incondicionado para la tabla que se reproduce abajo
mediante el programa TMP.EXE. La tabla ha sido obtenida tomando 19 indivi-
duos al azar y clasificndolos en base a las caractersticas reseadas. El obje-
tivo es contrastar la independencia de ambas caractersticas (Fumar y presen-
cia de Cardiopata)
Cardiopata
Total
S NO
S 5 1 6
Fumar
NO 4 9 13
Total 9 10 19
Ntese que los datos indican una asociacin positiva (59 > 14):
Meter tabla orden B (el ptimo) 2 colas P = 0,04711 (0,01652 en
el test de una cola a la derecha).
Si no fuera posible el orden B por causa del tamao muestral (no es el ca-
so actual) se usa el B o, si tampoco es posible, el FM (por las selecciones
de la cartula).
Si tampoco fuera posible el orden FM, se utiliza el programa SMP.EXE
asumiendo que las filas estn fijadas -lo que da P (n1 fijo)-, que las co-
lumnas estn fijadas -lo que da P (a1 fijo)- y haciendo que el valor P ac-
tual sea P = Mx {P (n1 fijo); P (a1 fijo)}.
Si tampoco fuera posible aplicar el programa SMP.EXE, se utiliza el test
exacto de Fisher.
PRCTICAS DE ORDENADOR D
Realizar el test asinttico chi-cuadrado para el ejemplo de la tabla de abajo
para todos los modelo (todos los totales fijados, totales de fila fijados, totales
de columna fijados y solo el total de 150 est fijado) y todos los tipos de test
(una o dos colas) utilizando el programa Z_INDEP.EXE.
Los tres test asintticos de tipo chi-cuadrado (condicionado, incondicionado para
contrastar la homogeneidad de dos proporciones independientes e incondiciona-
Temas 1.1 y 1.2: TEST EXACTOS Y ASINTTICOS EN TABLAS 22 31
Antes 60 20 80
Despus 40 30 70
Totales 100 50 150
TWO-TAILED TEST
MARGINAL FIXED | CHI-SQUARE | P-VALUE(%) | VALID IF E>E*:
cdv del test
--------------------------------------------------------------------
Rows and Column (1) Yates=4.584 (2) 2.50 (4) E*=0.0 (5)
(n1,n2,a1,a2) Mantel=5.628 for x1=46 (3)
(1) Indica que se asume que todos los marginales estn fijados.
(2) Chi-cuadrado de Yates para la tabla original.
(3) Chi-cuadrado de Yates para la tabla de la otra cola (que es la de x1 = 46).
(4) p-value asinttico del procedimiento (similarmente en lo que sigue).
(5) El test es vlido pues E = 23.3 > E* = 0 (similarmente en lo que sigue).
--------------------------------------------------------------------
Rows (n1,n2) (6) Martn et al.=5.311 (7) 2.12 E*=5.6
Column (a1,a2) (8) Martn et al.=5.311 2.12 E*=5.3
(6) Se asume que los tamaos de muestra son los totales de fila.
(7) p-value del modelo asumido (similarmente en lo que sigue).
(8) Se asume que los tamaos de muestra son los totales de columna.
--------------------------------------------------------------------
32 BIOESTADSTICA