Está en la página 1de 76

276

"CONTRASTES DE HIPTESIS"

4.4 Parte bsica

277

4.4.1 Introduccin a los contrastes de hiptesis


La Inferencia Estadstica consta de dos partes: Estimacin y Contrastes de Hiptesis. La primera se ha estudiado en la unidad anterior y estaba destinada a tratar de determinar el valor de un parmetro poblacional, a partir de lo observado en la muestra. La tcnica de Contraste de Hiptesis es preciso para establecer procedimientos para aceptar o rechazar hiptesis estadsticas emitidas acerca de un parmetro, u otra caracterstica de la poblacin. La nica forma de saber con certeza absoluta que una hiptesis estadstica es verdadera, es examinar toda la poblacin. Pero esto, en la mayora de los casos resulta, imposible (por falta de medios econmicos, imposibilidades tcnicas, etc.). Por lo tanto, la decisin debe adoptarse a partir de los resultados de una muestra de la poblacin (supuesta representativa), que nos inducir a tomar la decisin sobre la verdad o falsedad de la hiptesis. Pero es difcil sta decisin, porque aunque sepamos exactamente el valor del parmetro de la poblacin, en las muestras es muy difcil que se verifique ese valor exacto, por lo que debemos decidir unos lmites de valores del parmetro en la muestra, que nos puedan llevar a la decisin de aceptar el valor del parmetro poblacional. Por ejemplo, si una poblacin es normal N(150, 30), en todas las muestras de tamao 36, aproximadamente en un 2% de ellas, la media muestral superar las 160 unidades, y en otro 2% aproximadamente ser inferior a las 140 unidades. El problema, es pues, decidir a partir de qu valores de la media muestral podemos aceptar que la media poblacional es de 150 unidades, y todo ello siempre con un margen de error.

278

4.4.2 Conceptos bsicos


4.4.2.1 Hiptesis nula e Hiptesis alternativa
A la hiptesis que se desea contrastar la denominaremos Hiptesis nula, y la denotaremos por Ho. Esta hiptesis nula es la que se somete a comprobacin, y es la que se acepta o rechaza, como la conclusin final de un contraste. Puede surgir de diversos modos (Por discusiones tericas, como modelo terico, por la experiencia, por intuicin, etc.). Esta hiptesis nula lleva consigo una hiptesis alternativa, denotada por Ha o H 1. La hiptesis alternativa ser la que se acepta si se rechaza Ho y viceversa En el ejemplo del prrafo anterior, si tratamos de determinar la media poblacional (supuesta desconocida), la hiptesis nula podra ser: Ho: Media poblacional = 150. En ste caso, la hiptesis alternativa tendra la siguiente expresin: Ha: Media poblacional ! 150.

4.4.2.2 Estadgrafo de contraste


El contraste de hiptesis, es pues, un mecanismo mediante el cual se rechaza la hiptesis nula cuando existan diferencias significativas entre los valores muestrales y los valores tericos, y se acepte en caso contrario. Estas variables se medirn mediante una variable denominada estadgrafo de contraste, o estadstico de contraste, que sigue una distribucin determinada conocida, y que para cada muestra tomar un valor particular.

279

En el ejemplo anterior, el estadstico de contraste puede ser la media muestral, pero segn hemos visto en unidades anteriores, conocemos que la variable

x! Z= "
n

con n > 30

sigue una distribucin normal N(0,1), por lo que puede utilizarse sta variable como un estadstico de contraste, ya que se conoce su distribucin.

4.4.2.3 Regin crtica y regin de aceptacin


Denominaremos regin crtica, al conjunto de valores del estadstico de contraste que nos lleva a rechazar la hiptesis nula. La regin crtica es el conjunto de valores del estadstico de contraste que nos induce a rechazar la hiptesis nula En el ejemplo anterior, si tomamos la media muestral como estadstico de contraste, la regin crtica seran los valores de la media muestral superiores a 159.8, o inferiores a 140.2. Pero si tomamos el estadstico Z, la regin crtica seran los valores de Z cuyo valor absoluto sea mayor que 1.96. Llamaremos regin de aceptacin, al conjunto de los valores del estadstico que nos llevan a aceptar la hiptesis nula. La regin de aceptacin es el conjunto de los valores del estadstico que nos induce a aceptar la hiptesis nula.

4.4.2.4 Error tipo I y Error tipo II


Obviamente la conclusin tras un contraste de hiptesis puede ser cierta o no, ya que no sabemos con certeza cul es la situacin verdadera. Esto nos puede llevar a las situaciones reflejadas en el siguiente cuadro:

280

Decisin Aceptar Ho Hiptesis cierta Ho H1


O bien reflejadas en la siguiente forma: . Si la hiptesis nula es cierta y se acepta, la decisin es correcta. . Si la hiptesis nula es cierta y se rechaza sta, se comete un error; a este error le denominaremos error de tipo I. . Si la hiptesis alternativa es cierta y se acepta la hiptesis nula, se comete un error; a ste error le denominaremos error de tipo II. . Si la hiptesis alternativa es falsa y se rechaza la hiptesis nula, la decisin es correcta.

Rechazar Ho Error tipo I Correcta

Correcta Error tipo II

4.4.2.5 Nivel contraste

de

significacin

potencia

del

Nivel de significacin del contraste es la probabilidad de cometer un error del tipo I, es decir, de rechazar la hiptesis nula siendo cierta, acostumbra a denotar por ! ! = P(cometer error tipo I) = P(rechazar Ho siendo cierta) y se

La interpretacin estadstica del error tipo I es la siguiente: Si el experimento se repitiera un gran nmero de veces, sobre una poblacin con media de 150 unidades, en el 100(1 - a)% de los casos, ese experimento llevara a la conclusin verdadera de que = 150, y en el 100 a% de las veces conducira a la decisin falsa de que ! 150.

281

La probabilidad de cometer error del tipo II se denota por " " = P(cometer error tipo II) = P(aceptar Ho siendo falsa) Su complementario hasta uno es lo que se llama potencia del contraste La potencia del contraste, es la probabilidad de rechazar la hiptesis nula siendo sta falsa., es decir, aceptar la hiptesis alternativa siendo cierta. La interpretacin estadstica del error tipo II es la siguiente: Si el experimento se repitiera un gran nmero de veces, sobre una poblacin con media de 150 unidades, en el 100"% de los casos, ese experimento llevara a la conclusin falsa de que = 150, y en el 100 (1 - ")% de las veces conducira a la decisin verdadera de que ! 150. Estas probabilidades se pueden conocer: Si en el ejemplo de una poblacin normal N(, 30) tomamos una muestra de 36 elementos, y contrastamos Ho (=150) contra la hiptesis alternativa Ha (=165), y consideramos como regin de aceptacin el intervalo (140, 160), entonces la probabilidad de cometer error tipo I, es la probabilidad de que la media muestral pertenezca a la regin crtica; es decir, sea mayor que 160, o menor que 140 unidades, y la hiptesis nula sea cierta. As ! = P(cometer error tipo I) = P( x " 160/N(150,30))+P( x # 140/N(150,30))= =P(Z " 2) + P(Z # -2) = 0.0228 + 0.0228 = 0.0456 lo que nos da cierta informacin sobre la posibilidad de acertar en nuestra decisin, aunque no sepamos el verdadero valor del parmetro poblacional. Anlogamente se puede calcular la probabilidad de cometer error tipo II, es decir, de que la media muestral pertenezca al intervalo (140, 160) y sea cierta la hiptesis alternativa: " = P(cometer error tipo II) = P(140 # x # 160/N(165,30))= P(-5 # Z # -1) = P(Z # -1) - P(Z # -5) = 0.1687 - 0.00001 = 0.168699.

282

4.4.2.6 Tipo de contraste


Segn que la regin crtica contenga una o dos regiones, diremos que el contraste es unilateral, o bilateral.

Estos son los conceptos iniciales que deben tenerse en cuenta en un contraste de hiptesis.

4.4.2.7 Pasos en un contraste de hiptesis


Veamos ahora los pasos que son convenientes seguir para realizar el contraste de hiptesis: 1 Determinar, claramente, la hiptesis nula Ho y la hiptesis alternativa Ha. 2 Elegir el nivel de significacin. 3 Seleccionar un estadstico cuya distribucin muestral sea conocida en el caso de que la hiptesis nula sea cierta. 4 Determinar la regin crtica. 5 Calcular el valor del estadstico de contraste para la muestra elegida. 6 Sacar las conclusiones estadsticas del contraste (aceptar o rechazar Ho). 7 Sacar las conclusiones no estadsticas (biolgicas, mdicas, econmicas, etc.) a que nos llevan los resultados estadsticos.

283

4.4.3 Contraste para la media de una poblacin normal


4.4.3.1 Contraste para la media de una poblacin normal, con varianza poblacional conocida
Supongamos que queremos contrastar la hiptesis de que la media de una poblacin normal, toma un valor especfico o , cuando la varianza #2 de la poblacin es conocida.

! !

En ste caso, la hiptesis nula ser, en general: Ho ( = o ) Mientras que la hiptesis alternativa puede tener diversas expresiones:

Ha ( = 1 ) , o bien, Ha ( < o ), Ha ( > o ), o bien Ha ( ! o ). ! Estadgrafo de contraste: El contraste se efectuar tomando muestras aleatorias de tamao n. Conocemos que la distribucin de la media muestral sigue una distribucin normal N(, #/$n). Entonces, si x es la media de una muestra de tamao n, entonces la variable

x! Z= " o
n

seguir, cuando la hiptesis nula sea cierta una distribucin normal estndar N(0,1). Se puede utilizar as pues sta variable como estadstico de contraste en ste caso. ! Nivel de significacin: El nivel de significacin ser !, que, generalmente

tomar los valores 0.1, 0.05 0.01. ! Regin crtica: Si la hiptesis nula fuese cierta y = o , cabe esperar que la media muestral x se distribuya en torno al valor o, es decir, x - o tendr un valor elevado para que existan evidencias de que la hiptesis nula sea falsa, es decir, la variable Z tomar un valor absoluto grande; as pues, la regin crtica estar formada por los valores de Z elevados, tanto positivos como negativos. Para especificar cuando se consideran

284

elevados, teniendo en cuenta la distribucin de Z, sern aquellos que sean mayores, en valor absoluto, que z!/2, en el contraste bilateral, o que z! en el contraste unilateral. Si la hiptesis nula fuese Ho ( " o ), entonces dejaran de pertenecer a la regin crtica los valores positivos grandes, y el contraste es, en ste caso, unilateral. (Ver figuras 4.2 y 4.3).

1-! ! /2 -z! /2
Regin crtica

nivel de significacin

! /2 0
Regin de Aceptacin

z! /2
Regin crtica

Figura 4.10: Regiones crtica y de aceptacin en un contraste bilateral cuando la distribucin es normal estndar.

1- !

nivel de significacin

0
Regin de Aceptacin

z!
Regin crtica

Figura 4.11: Regiones crtica y de aceptacin en un contraste unilateral cuando la distribucin es normal estndar.

285

4.4.3.2 Contraste para la media de una poblacin normal, con varianza poblacional desconocida
MUESTRAS GRANDES
! Estadgrafo de contraste: En el mismo caso que en el prrafo anterior, y con las mismas hiptesis, si el tamao de la muestra es suficientemente grande (n > 30), aunque sea desconocida la varianza poblacional, se consiguen buenos resultados utilizando como estimador de la varianza poblacional la cuasi-varianza muestral y, por lo tanto, se puede tomar como estadstico de contraste el mismo que se tom cuando la varianza poblacional era conocida; es decir

Z=

x ! o
s n

es una variable que sigue una distribucin normal estndar N(0,1), por lo que el razonamiento es idntico al caso anterior.

MUESTRAS PEQUEAS
! Estadgrafo de contraste: Si el tamao de la muestra es pequeo (n < 30), sabemos de unidades anteriores que la variable

t=

x ! o
s n !1

difiere sensiblemente de una distribucin normal, aproximndose bastante mejor por una distribucin t de Student, con n-1 grados de libertad, por lo que sta variable t puede utilizarse con un estadstico de contraste. ! Regin crtica: La regin crtica, en ste caso, estar determinada por los valores de la variable t que sean excesivamente grandes en valor absoluto, si el contraste es bilateral, y para especificar el nivel de cuando pueden considerarse grandes, teniendo en cuenta la

286

distribucin de la variable t, que sigue una distribucin t con n-1 grados de libertad, sern aquellos valores mayores que t!/2,n-1 en el contraste bilateral, o que t!,n-1 en el contraste unilateral. Las regiones crticas sern pues, anlogamente al caso de la varianza poblacional conocida, los siguientes (ver figuras 4.4 y 4.5):

nivel de confianza

!/2

1"!

!/2
nivel de significacin

-t !/2
Regin crtica

0
Regin de Aceptacin

t !/2
Regin crtica

Figura 4.12: Regiones crtica y de aceptacin en el contraste bilateral cuando la variable se distribuye segn una t de Student.

Figura 4.13: Regiones crtica y de aceptacin en el contraste unilateral cuando la variable se distribuye segn una t de Student.

287

4.4.4 Contraste de hiptesis para la igualdad de medias de dos poblaciones normales


En este apartado consideraremos dos poblaciones con distribuciones normales con 2 medias 1 y 2 y varianzas !1 y !2 2 respectivamente, de las cuales extraemos muestras aleatorias independientes de tamaos n1 y n2 respectivamente. El objetivo de ste apartado ser determinar si las dos poblaciones pueden considerarse con la misma media poblacional, es decir, la hiptesis nula ser Ho (1 = 2 ), mientras que la hiptesis alternativa puede tener diversas expresiones: Ha (1 < 2 ), o bien, Ha (1 > 2 ), o bien Ha (1 ! 2 ). Estas hiptesis son equivalentes a las siguientes: la hiptesis nula ser Ho (1 - 2 = 0), mientras que la hiptesis alternativa tendr stas expresiones: Ha (1 - 2 < 0), o bien, Ha (1 - 2 > 0), o bien Ha (1 - 2 ! 0).

4.4.4.1 Contraste de hiptesis para la igualdad de medias de dos poblaciones normales con varianzas poblacionales conocidas.
! Estadgrafo de contraste: Conocemos del tema relacionado con las distribuciones normales, que la diferencia de dos distribuciones normales se distribuye tambin normalmente con media la diferencia de las medias, y varianza la suma de las varianzas, por lo que la variable # 2 & "1 "2 + 2 ( , por x1 ! x2 ser una variable que se distribuye normalmente N% 1 ! 2 , n1 n2 ' $ lo que en el caso particular de conocer las varianzas poblacionales, podemos utilizar como estadstico de contraste la variable

Z=

x1 ! x2
2 "2 "1 + 2 n1 n 2

288

que, en el caso de que la hiptesis nula sea cierta (1 = 2 ), se distribuye como una distribucin normal estndar N(0,1), y, por lo tanto, puede utilizarse como estadstico de contraste, dado que conocemos su distribucin.

! Regin crtica: La regin crtica estar formada por los valores de Z elevados, tanto positivos como negativos. Para especificar cuando se consideran elevados, teniendo en cuenta la distribucin de Z, sern aquellos que sean mayores, en valor absoluto, que Z!/2, en el contraste bilateral, o que z! en el contraste unilateral.

4.4.4.2 Contraste de hiptesis para la igualdad de medias de dos poblaciones normales con varianzas poblacionales desconocidas pero iguales
MUESTRAS GRANDES ! Estadgrafo de contraste: Supongamos ahora que las varianzas son desconocidas pero iguales (#1 = #2 = #). Si las muestras tienen tamao grande, aunque no se conozca la varianza poblacional, se trabaja como si se conociese utilizando en lugar de la varianza poblacional, su estimador la cuasivarianza muestral, por lo que la distribucin de la diferencia de " 1 1 % ' , medias muestrales es ahora N $ 1 ! 2 , s + n1 n2 & # siendo s= estndar
2 + (n ! 1)s 2 (n1 ! 1) s1 2 2 , por lo que la variable tipificada es una normal n1 + n2 ! 2

Z=

( x1 ! x2 ) ! (1 ! 2 )
1 + 1 S n1 n2

Entonces, si ha hiptesis nula es cierta, (1 =2 ), la variable

Z=

( x1 ! x2 )
S 1 1 + n1 n 2

289

se distribuye como una distribucin normal estndar, por lo que se puede utilizar como un estadstico de contraste.

! Regin crtica: La regin crtica se determina igual que en el prrafo anterior, es decir, para los valores de Z mayores, en valor absoluto, que z!/2 (contraste bilateral), o que z! (contraste unilateral).

MUESTRAS PEQUEAS ! Estadgrafo de contraste Pero, si las muestras son pequeas (n1 + n2 < 30), entonces la variable siguiente

t=

(x1 ! x2 ) ! ( 1 ! 2 ) 1 + 1 S n1 n2

= con S

2 + (n ! 1)S 1 2 (n1 ! 1)S 2 2 , sigue una distribucin t de Student con n +n -2 1 2 n1 + n2 ! 2

grados de libertad. Si la hiptesis nula es cierta, el estadgrafo de contraste que utilizaremos es

t=

(x1 ! x2 ) 1 + 1 S n1 n 2

porque se distribuye como una t de Student con n1+n2-2. ! Regin crtica: La regin crtica viene determinada por los valores de esta variable t, que son mayores en valor absoluto que t!/2 en el contraste bilateral, o bien los valores de t, que son mayores en valor absoluto que t! en el contraste unilateral.

290

4.4.5 Contraste binomiales


grandes, de tamao > 30.

para

distribuciones

Estudiaremos slo contrastes en los que sea posible aproximaciones de la binomial mediante la normal, por lo que estudiaremos slo los casos de muestras

4.4.5.1 Contraste para el parmetro p de una distribucin Binomial


Partimos de una poblacin que se ajuste al modelo binomial B(n, p), siendo p la ! probabilidad de "xito"; denotaremos por p a la proporcin muestral de casos favorables y por po el valor hipottico con el que queremos contrastar el valor del parmetro p.

! Hiptesis de partida En ste caso, la hiptesis nula ser: Ho : p = p o y la hiptesis alternativa puede ser: Ha : p ! po en el contraste bilateral, o bien Ha : p > po , en el contraste unilateral (tambin Ha : p < po).

! Estadgrafo de contraste: Como conocemos que la distribucin binomial B(n, p) se aproxima mediante una variable normal N(np, npq ), entonces, se verifica que la variable ! po p Z= (1 ! p ) p n se distribuye como una distribucin normal estndar N(0,1).

291

! Regin crtica: La regin crtica, ahora, ser la determinada por los valores de la variable Z que son mayores en valor absoluto que z!/2 , en el contraste bilateral, o bien, mayores que z! , en el contraste unilateral.

4.4.5.2 Contraste para la igualdad de los parmetros de dos distribuciones binomiales


Partimos, en ste caso, de dos distribuciones binomiales B(n1, p1) y B(n2, p2) 1 y respectivamente. En las muestras los parmetros muestrales sern p p2 respectivamente.

! Hiptesis de partida: La hiptesis nula ser: Ho : p 1 = p 2 mientras que la hiptesis alternativa puede ser : Ha : p 1 ! p 2

! Estadgrafo de contraste: Ahora, teniendo en cuenta las propiedades de las distribuciones normales, por las que se aproximan las binomiales, se verifica que la variable

Z=

! ! p1 ! p2 ! ! ! ! p1(1 ! p1) p2 (1 ! p 2 ) + n1 n2

se distribuye, cuando la hiptesis nula es cierta, como una distribucin normal estndar N(0,1)

! Regin crtica:

292

La regin crtica ser anloga a todas aqullas en el que el estadstico de contraste sigue una distribucin normal.

293

"CONTRASTES DE HIPTESIS"

4.5 Ampliacin

294

4.5.1 Introduccin y motivacin


Antes de comenzar con el desarrollo del tema se supone que el lector conoce los conceptos fundamentales de muestreo, los principales estimadores de los parmetros de distribuciones normales y sus correspondientes distribuciones muestrales, y los conceptos bsicos asociados a los contrastes de hiptesis como son el riesgo tipo I, tipo II, potencia del contraste, etc.... Aunque muchos de los conceptos han sido ya explicados en la parte bsica, se repiten aqu encuadrados en el problema general de la investigacin aplicada aadiendo una posible gua para la explicacin de los mismos en contextos aplicados a las ciencias experimentales.

Comenzaremos ilustrando las ideas generales sobre el contraste ms simple, el de la media de una poblacin Normal, para ir extendiendo progresivamente las ideas a dos poblaciones, a la comparacin de proporciones y a las poblaciones no normales. Analizaremos la problemtica de realizar un nmero elevado de contrastes sobre el mismo conjunto de datos, y extenderemos las ideas fundamentales al diseo de experimentos con varios grupos experimentales.

4.5.2 Contraste para la media de una poblacin Normal


4.5.2.1 Planteamiento general
Consideremos un caso muy simple mediante un ejemplo concreto. Supongamos que pertenecemos al consejo regulador de la denominacin de origen de los vinos de Ribera de Duero. Sabemos que los vinos jvenes de aos anteriores tienen un grado alcohlico medio de 12.5 grados, tal y como aparece en la etiqueta. Para el ao actual, el consejo regulador, de acuerdo con todos sus miembros, ha decidido cambiar algunos de los pasos del proceso de fabricacin. El primer problema que se plantea es: Se ha modificado el grado alcohlico al modificar el proceso de fabricacin?.

295

La definicin del problema a estudiar nos permite determinar la poblacin que queremos estudiar, los vinos jvenes de ribera de Duero en el ao actual; la variable que queremos medir, el grado alcohlico de los mismos, y la hiptesis de trabajo inicial Se ha modificado el grado alcohlico?. El paso siguiente consiste en suponer un modelo de comportamiento terico para la poblacin (a priori). Suponemos que la variable que estamos midiendo en la poblacin a estudiar sigue una distribucin Normal. La suposicin de normalidad la haremos de acuerdo con el conocimiento previo que tengamos sobre la poblacin objeto de estudio tratando de que las caractersticas de la distribucin reflejen en la mayor medida posible las de la poblacin, se trata simplemente de buscar un modelo probabilstico que aproxime la variable a estudiar. En el caso que nos ocupa, parece razonable suponer, a priori, que el grado alcohlico se concentra de forma simtrica alrededor de un valor medio. Si considerramos, por ejemplo, los salarios de una empresa la hiptesis de normalidad no es plausible puesto que cabe esperar que la distribucin de los mismos sea marcadamente asimtrica debido a los altos salarios de un grupo reducido de ejecutivos. Formularemos ahora la hiptesis de trabajo en trminos de los parmetros del modelo (media y/o desviacin tpica en el caso de la Normal). La hiptesis principal la denominamos hiptesis nula (H0).

H0 = = 0 = 12.5
La hiptesis nula suele ser la de igualdad del parmetro a un nico valor concreto o procedente de la hiptesis de trabajo. Junto con la hiptesis nula planteamos la que denominamos hiptesis alternativa (Ha o H1) que ser aceptada cuando se rechace la nula y viceversa. Por el momento tomaremos la ms sencilla, la hiptesis e que la media es diferente de 12 que resultar en un contraste bilateral.

Ha = ! 0 = 12.5
Trataremos de disear un procedimiento para decidir entre ambas hiptesis a partir de la informacin contenida en una muestra de tamao n, por ejemplo 14 observaciones.

296

Supongamos que la muestra ha sido seleccionada al azar de la poblacin y que se han obtenido los resultados siguientes.

RIBERA DE DUERO 12,8 12,8 12,5 11,9 12,5 12,1 12,2 12,6 13,0 12,4 12,6 12,2 12,8 13,0
Tabla 4.1: Grado alcohlico de 14 vinos de la denominacin de Ribera de Duero.

La primera cuestin que hemos de tener en cuenta es que la decisin por una hiptesis concreta ha de tomarse con un cierto riesgo de equivocarse al no disponer de la informacin de todos los individuos de la poblacin. Trabajaremos con la media muestral como estimador de la media poblacional desconocida. En el ejemplo la media muestral es de 12,529, que como ya sabemos no coincide con la media poblacional. Trataremos de decidir entre las dos hiptesis a partir del valor de la media muestral pero, si la media muestral no coincide con la media poblacional, ser la diferencia entre el valor observado y el terico lo suficientemente grande como para rechazar la hiptesis nula? o la diferencia observada es lo suficientemente pequea como para ser debida simplemente al azar o al desconocimiento de la poblacin?. Daremos respuesta a ambas preguntas utilizando los conceptos sobre distribuciones aprendidos en temas anteriores.

4.5.2.2 Varianza (desviacin tpica conocida)


Supondremos, por el momento, que la varianza de la poblacin es ! = 0.5
2 2

conocida. Sabemos que la media muestral para distintas muestras sigue una distribucin ! ) , luego, cuando la hiptesis nula es cierta Normal N( , n

x ! N( 0 ,

" ) n

En la prctica, este resultado tiene implicaciones importantes. Vemoslo con un dibujo (figura 4.7).

297

x ! N( 0 , " ) n

0
Figura 4.14: Distribucin de la media muestral.

El dibujo muestra cmo, aunque los valores de la media muestral no coinciden con la media poblacional, se concentran en torno a ella y por tanto es muy probable que sean cercanos aunque, con el modelo supuesto puede tomar cualquier valor. Obsrvese tambin que cuanto mayor es el tamao muestral ms se concentran los valores de la media muestral en torno a la media poblacional. Intuitivamente, aceptaremos la hiptesis nula cuando la media muestral sea prxima a 0 y la rechazaremos (aceptando la alternativa) cuando la media muestral sea muy diferente de 0 , es decir, utilizamos la media muestral como estadstico, o estadgrafo, de contraste. Nos queda por determinar cual es el criterio para decidir si la media muestral est prxima o no al valor terico propuesto utilizando el concepto de riesgo tipo I definido previamente. Fijamos el riesgo tipo Y en ! (por ejemplo en 0.05 o el 5%) Nos plantearemos el contraste como un juicio en el que la media muestral es inocente (procede de una poblacin con media 0 ) y no la declararemos culpable (no procede de una poblacin con media 0 ) hasta que no se demuestre claramente lo contrario. Sobre la distribucin de la media seleccionamos dos puntos 0 ! a y 0 + a , simtricos alrededor de 0 de forma que si la hiptesis nula cierta en el (1-!)100% (por ejemplo el 95%) de las muestras la media muestral est entre esos dos valores (figura 4.8).

P( 0 ! a " x " 0 + a) = 1 ! #

298

Figura 4.15: Procedimiento de contraste a partir de la media muestral

Aceptaremos la hiptesis nula si la media muestral est dentro del intervalo seleccionado y la rechazaremos en caso contrario. Es claro que si la media est fuera del intervalo seleccionado hay una clara evidencia de que la hiptesis no es cierta ya que toma los valores correspondientes solo en el 5% de los casos en los que la hiptesis nula es cierta. Por supuesto, estamos asumiendo un riesgo del 5% de equivocarnos y rechazar indebidamente. Como ya es conocido, al conjunto de valores que nos llevan a aceptar la hiptesis nula lo denominamos Regin de Aceptacin, y al conjunto de valores que nos llevan a rechazarla Regin Crtica. En este caso la regin crtica se ha dividido en las dos colas de la distribucin por lo que se dice que el contraste es bilateral o de dos colas. En la prctica no se trabaja directamente con la media muestral y su distribucin asociada sino con la distribucin Normal estndar. Teniendo en cuenta las propiedades de la Normal podemos escribir
x ! P( 0 ! a " x " 0 + a) = P( !z# /2 " $ 0 " z # / 2 ) = 1 ! # n

de forma que el procedimiento descrito se convierte ahora en el que se muestra en la x! figura 4.9. El estadgrafo de contraste es ahora " 0 y mide la discrepancia entre el n valor observado de la media l valor terico de la misma, en la escala de la desviacin

299

tpica. No es lo mismo una diferencia de una unidad en una escala de centmetros que en una escala de kilmetros.

Figura 4.16: Procedimiento de contraste a partir de la media muestral estandarizada.

La interpretacin intuitiva del nuevo procedimiento sigue siendo clara, rechazaremos la hiptesis nula solamente cuando la discrepancia entre la media observada y la terica ( x ! 0 ) sea grande, en relacin a la variabilidad intrnseca ! medida por . La magnitud de la diferencia necesaria para rechazar se determina a n travs del riesgo de tipo 1 mediante la distribucin Normal estndar. A los valores de z!/2 se les suele denominar valores crticos ya que determinan la frontera entre la regin crtica y la regin de aceptacin. El cuadro 4.2 muestra el procedimiento completo con los pasos que se siguen habitualmente en la construccin de cualquier contraste.

300

Hiptesis H0 : = 0

Ha : ! 0
Nivel de significacin: ! x ! Estadgrafo de contraste: Z = " 0 n Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1) Regin de aceptacin: {Z / Z ! z " / 2 } Regin critica: {Z / Z > z ! / 2 }

Cuadro 4.2: Contraste para la media de una poblacin Normal con varianza conocida.

Una vez que hemos determinado la forma general del contraste pasamos a aplicarlo a los datos del problema inicial que nos ocupa (ver cuadro 4.3). Hiptesis:

H0 : = 12.5 Ha : ! 12.5
Nivel de significacin: 5% y 1%. x ! 12.529 ! 12.5 = 0.217 Estadgrafo de contraste: Z = " 0 = 0.5 n 14 Valores crticos : para el 5% z0.025= 1,96 para el 1% z0.005= 2,57 Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de aceptacin, por tanto aceptamos la hiptesis nula. Conclusin no estadstica: La modificacin en el proceso de fabricacin no ha modificado significativamente el grado alcohlico.
Cuadro 4.3: Aplicacin del contraste para la media de una poblacin Normal con varianza conocida al problema de la modificacin en el grado alcohlico del vino de Ribera de Duero

Una vez que hemos tomado la decisin final, no sabemos si es correcta o no, simplemente esperamos que sea del 95% de las muestras en las que aceptamos la hiptesis correctamente. Si aceptamos la hiptesis nula no quiere decir que sea cierta y el grado medio sea exactamente de 12.5 grados (probablemente no lo es), sera ms correcto interpretar que, con la informacin de la que disponemos no hemos encontrado evidencia suficiente de que la media sea distinta de 12.5. Evidentemente, los valores muestrales son compatibles con muchos otros posibles valores tericos. Si aumentamos el tamao de muestra indefinidamente, la variabilidad de la media

301

sera cada vez menor y conseguiramos que la pequea diferencia observada sea lo suficientemente grande como para considerarla significativa. Es por esto por lo que en Estadstica decimos que es tan malo tener un tamao de muestra demasiado alto como tenerlo demasiado bajo ya que en el primer caso cualquier pequea diferencia es considerada como significativa mientras que en el segundo no se declara significacin incluso en el caso en el que la diferencia sea elevada.

4.5.2.3 La potencia de un contraste


En todo el proceso descrito hasta el momento solamente se ha utilizado el riesgo de tipo I en el desarrollo del contraste. Sabemos que esta asociado con el riesgo de tipo II de forma que cuando uno aumenta, el otro disminuye. Tampoco hemos hecho ninguna afirmacin acerca de un concepto importante como es el de potencia del contraste (probabilidad de rechazar la hiptesis nula cuando es falsa). No es posible calcular la potencia del contraste porque para ello necesitaramos un nico valor en la hiptesis alternativa (revsese el ejemplo de los cirrticos utilizado como aplicacin de la distribucin Normal), aunque si podemos realizar el clculo para distintos valores en la alternativa (funcin de potencia) y analizar lo que ocurre. Vemoslo con un ejemplo. Cual sera la potencia del contraste obtenido para detectar que la media no es 12.5 si en realidad la media fuera 13 (y suponiendo un nivel de significacin del 5%). En trminos de la media muestral el procedimiento de contraste consiste en aceptar la hiptesis nula si la media muestral est entre 12.238 y 12.762. La probabilidad de cometer un error de tipo 2 (aceptar indebidamente) si la media real fuera de 13 se podra calcular como P(12.382 ! X ! 12.762) en una Normal de media 0.5 13 y desviacin tpica . Esta probabilidad es 0.037 de forma que la potencia es 1 14 0.037 = 0.963. La situacin esquematizada aparece en la figura 4.10.

302

Figura 4.17: Clculo de la potencia del contraste para una alternativa predeterminada.

En la figura 4.11 se muestra la funcin de potencia para distintos valores posibles de la hiptesis alternativa.

Figura 4.18: Funcin de potencia para distintos valores de la alternativa.

El grfico muestra como la potencia es mayor cuando los valores de la alternativa se alejan del valor para la hiptesis nula. En la prctica este hecho tiene una implicacin obvia: es ms fcil detectar diferencias o efectos experimentales de gran magnitud. Aunque no es posible un control directo de la potencia, a la vista de la figura 4.10

303

es claro que la potencia puede modificarse modificando el nivel de significacin o el tamao muestral ya que la forma de las curvas depende de ste. Cuanto mayor sea el tamao muestral ms concentrada es la curva Normal y, por tanto, mayor es la potencia para el mismo nivel de significacin. En la prctica suele hacerse un estudio de potencia para los contrastes no significativos, calculando cual sera el tamao muestral necesario para que la diferencia observada en los datos sea significativa. Si este tamao es muy grande es difcil declarar la significacin por lo que consideraremos que estamos haciendo lo correcto, si el tamao muestral necesario es pequeo, sera conveniente revisar el experimento. El clculo es muy simple cuando se trabaja con distribuciones normales. La x ! 0 > z # / 2 de forma que, para que la diferencia hiptesis nula se rechaza cuando " n sea significativa el valor de n ser
z2 "2 n > !/ 2 x # 0

para el ejemplo del grado alcohlico, n> 1141,97, es decir, para que la diferencia observada fuera significativa tendramos que haber recogido ms de 1142 observaciones lo que da una idea de que la diferencia observada es muy pequea y, por tanto es muy probable que la hiptesis nula sea cierta.

4.5.2.4 El p-valor del contraste


Una forma habitual de medir la significacin en los contrastes de hiptesis es el denominado p-valor del contraste. Su utilizacin en la investigacin aplicada es debida a que es la forma de presentacin de los resultados de un contraste usada por la mayor parte de los programas de ordenador. Se puede definir el p-valor de un contraste como la probabilidad de obtener un valor muestral ms extremo que el obtenido en nuestro caso particular (cuando H0 es cierta). Si el p-valor es muy pequeo rechazaremos la hiptesis nula ya que el valor experimental es muy extremo, mientras que si el p-valor es grande aceptaremos la hiptesis nula ya que el valor es compatible con la misma.

304

De forma general, el p-valor para el contraste actual se puede calcular como # x ! & P% Z > " 0 ( en una distribucin Normal estndar. $ n ' Para el ejemplo anterior el p-valor es 1-P(-0.217 < Z < 0.217) = 2 P(Z > 0.217) = 0.8285, es decir el p-valor puede considerarse grande. En la prctica se suele adoptar el criterio de aceptar la hiptesis cuando el p-valor es mayor que el nivel de significacin fijado en el procedimiento de contraste.

Figura 4.19: El p-valor de un contraste bilateral.

4.5.2.5 Los contrastes unilaterales


En algunas situaciones concretas no estamos interesados en todos los posibles valores de la hiptesis alternativa propuesta en un contraste bilateral. Supongamos, por ejemplo, que en el caso prctico anterior sospechamos a priori que la modificacin en el procedimiento de fabricacin produce un incremento en el contenido alcohlico. En este caso sera conveniente modificar la hiptesis alternativa para que sea de la forma Ha : > 0 . El procedimiento de contraste es muy similar al anterior y se muestra en el cuadro 4.4.

305

Hiptesis H0 : = 0

Ha : > 0
Nivel de significacin: ! x ! Estadgrafo de contraste: Z = " 0 n Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1) Regin de aceptacin: {Z / Z ! z " / 2 } Regin critica: {Z / Z > z ! / 2 }

Cuadro 4.4: Contraste unilateral superior para la media de una poblacin Normal con varianza conocida.

El contraste as obtenido se denomina contraste unilateral superior ya que solo estamos interesados en las desviaciones positivas. La diferencia fundamental con el contraste bilateral es que se produce un incremento en la potencia para detectar diferencias positivas de la hiptesis nula y un decremento drstico para detectar las negativas. El p-valor sigue teniendo la misma interpretacin aunque ahora se calcula como # x ! & P% Z > " 0 ( . $ n '

Figura 4.20: El p-valor de un contraste unilateral superior.

De la misma manera que se ha construido el contraste unilateral superior es posible construir el contraste unilateral inferior (ver cuadro 4.5) si estamos interesados

306

exclusivamente en detectar diferencias negativas con respecto a la hiptesis nula. La construccin del contraste es completamente anloga con la correspondiente modificacin de la hiptesis alternativa. El contraste unilateral inferior incrementa la potencia para detectar diferencias negativas aunque no tiene potencia para detectar las positivas. Hiptesis H0 : = 0

Ha : < 0
Nivel de significacin: ! x ! Estadgrafo de contraste: Z = " 0 n Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1) Regin de aceptacin: {Z / Z ! z " / 2 } Regin critica: {Z / Z < z ! / 2 } # x ! 0 & p-valor: P% Z > ( " $ n '

Cuadro 4.5: Contraste unilateral inferior para la media de una poblacin Normal con varianza conocida.

Figura 4.21: El p-valor de un contraste unilateral inferior.

La decisin por el tipo de contraste debe hacerse a priori, antes de tomar los datos. Supongamos, por ejemplo, que sospechamos, antes de realizar el experimento, que la modificacin en el proceso de fabricacin, aumenta el grado alcohlico. El procedimiento de contraste para los datos de la tabla 1 se muestra en el cuadro 4.6.

307

Hiptesis:

H0 : = 12.5 Ha : > 0
Nivel de significacin: 5% y 1%. x ! 12.529 ! 12.5 = 0.217 Estadgrafo de contraste: Z = " 0 = 0.5 n 14 Valores crticos : para el 5% z0.025= 1,65 para el 1% z0.005= 2,33 p-valor: 0.4129 Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de aceptacin, por tanto aceptamos la hiptesis nula. Conclusin no estadstica: La modificacin en el proceso de fabricacin no ha aumentado significativamente el grado alcohlico.
Cuadro 4.6: Aplicacin del contraste para la media de una poblacin Normal con varianza conocida al problema de la modificacin en el grado alcohlico del vino de Ribera de Duero

La funcin de potencia para distintos valores de la alternativa aparece en la figura 4.15. Obsrvese como el contraste no tiene ninguna potencia para detectar valores a la izquierda de la hiptesis nula.

Figura 4.22: Funcin de potencia para un contraste unilateral superior.

308

4.5.2.6 Varianza desconocida


En la mayor parte de las aplicaciones prcticas la varianza de la distribucin es tambin desconocida y ha de ser estimada a partir de los datos. El problema es que ya no es posible seguir utilizando la distribucin Normal para el procedimiento de contraste ya que es necesario eliminar el parmetro " del estadgrafo de contraste. De acuerdo con la teora, adems de la distribucin muestral de la media sabemos 2 (n ! 1)S que sigue una distribucin ji-cuadrado con n-1 grados de libertad. Si 2 " suponemos que media y varianza son independientes* , es posible combinar las correspondientes distribuciones muestrales para obtener una distribucin t de Student y eliminar el parmetro ". Utilizando la definicin de distribucin t de Student con n-1 grados de libertad como el cociente entre una Normal estndar y la raz cuadrada de una ji-cuadrado con n1 grados de libertad dividida por sus grados de libertad, y ambas independientes, obtenemos que la variable aleatoria

t=

x ! 0 " x ! n = 0 2 S (n ! 1)S n "2 (n ! 1)

sigue una distribucin t de Student con n-1 grados de libertad. El procedimiento de contraste en este caso es anlogo al anterior pero sustituyendo la distribucin Normal por la distribucin t. El cuadro 4.7 muestra el procedimiento de contraste completo.

La demostracin completa no se realiza aqu.

309

Hiptesis H0 : = 0

Ha : ! 0
Nivel de significacin: ! x ! 0 Estadgrafo de contraste: t = S n Distribucin del estadgrafo cuando la hiptesis nula es cierta: tn-1 Regin de aceptacin: {t / t ! t n "1, # } Regin critica: {t / t > t n !1, " } *

Cuadro 4.7: Contraste para la media de una poblacin Normal con varianza desconocida.

En la prctica, la sustitucin de la distribucin Normal por la distribucin t de Student implica un aumento de la dispersin por lo que es ms difcil detectar diferencias. La situacin se muestra el la figura 4.16 en la que se comparan la distribucin Normal estndar (en lnea discontinua) y la distribucin t (en lnea continua).

x " t = 0 # t n" 1 s n !/2

1"! !/2

-t !

t!

Figura 4.23: Diferencia entra la distribucin Normal y la distribucin t de Student.

Es posible construir contrastes unilaterales de la misma manera que en el caso de varianza conocida. El cuadro 4.8 muestra el contraste unilateral superior, el contraste unilateral inferior se deja como ejercicio al lector.

tn-1,! es el valor crtico de la t de Student tal que P(-tn-1,! ! tn-1 ! tn-1,! ) = 1-!. Se ha denotado con el

subndice ! porque es el que se utiliza para buscar el valor correspondiente en la tabla.

310

Hiptesis H0 : = 0

Ha : > 0
Nivel de significacin: ! x ! 0 Estadgrafo de contraste: t = S n Distribucin del estadgrafo cuando la hiptesis nula es cierta: tn-1 Regin de aceptacin: {t / t ! t n "1,2# }* Regin critica: {t / t > t n !1,2" }

Cuadro 4.8: Contraste para la media de una poblacin Normal con varianza desconocida.

Para el ejemplo del grado alcohlico de los vinos de la denominacin de origen de Ribera de Duero los resultados del contraste bilateral se muestran en el cuadro 4.9 Hiptesis:

H0 : = 12.5 Ha : ! 12.5
Nivel de significacin: 5% y 1%. x ! 0 12.529 ! 12.5 = 0.338 = 0.316 Estadgrafo de contraste: Z = S 14 n Valores crticos : para el 5% t0.05= 1,96 para el 1% t0.01= 2,57 p-valor : 0,7571 Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de aceptacin, por tanto aceptamos la hiptesis nula. Conclusin no estadstica: La modificacin en el proceso de fabricacin no ha modificado significativamente el grado alcohlico.
Cuadro 4.9: Aplicacin del contraste para la media de una poblacin Normal con varianza conocida al problema de la modificacin en el grado alcohlico del vino de Ribera de Duero

Todos los conceptos explicados para el contraste de la media de una poblacin Normal con varianza conocida siguen siendo vlidos aqu.

tn-1,2! es el valor crtico de la t de Student tal que P( tn-1 > tn-1,2! ) = !. Se ha denotado con el subndice

2! porque es el que se utiliza para buscar el valor correspondiente en la tabla.

311

4.5.2.7 Contrastes para muestras grandes


Cuando las muestras de las que se dispone son muestras grandes (aproximadamente mayores de 30 observaciones) es posible utilizar directamente la distribucin Normal ya que es muy similar a la t de Student. Adems el teorema central del lmite permite relajar la hiptesis de normalidad ya que la normalidad de la distribucin muestral de medias est garantizada, bajo ciertas condiciones de regularidad, aunque la poblacin original no sea Normal. Hay que tener en cuenta que se trata slo de una aproximacin y, cuanto mayor es el tamao de la muestra mejor es la aproximacin Normal obtenida. El procedimiento de contraste para muestras grandes se muestra en el cuadro 4.10. Mostramos solamente el contraste bilateral ya que los unilaterales se construyen exactamente de la misma manera que en los casos anteriores.

Hiptesis:

H0 : = 0 Ha : ! 0

Nivel de significacin: ! x ! 0 Estadgrafo de contraste: Z = S n Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0, 1) Regin de aceptacin: {Z / Z ! z " / 2 } Regin critica: {Z / Z > z ! / 2 }

Cuadro 4.10: Contraste para la media de una poblacin Normal con varianza desconocida cuando la muestra es grande.

312

4.5.3 Contraste para la diferencia de medias de dos poblaciones normales con datos independientes
4.5.3.1 Planteamiento general
En la investigacin aplicada la situacin ms habitual es aquella en la que se quieren comparar dos poblaciones a las que se les ha aplicado, por ejemplo, dos tratamientos diferentes. Pongmonos en el mismo supuesto que en el ejemplo que sirvi para ilustrar el contraste para una poblacin, y supongamos que lo que deseamos es conocer si los vinos de nuestra denominacin de origen tienen el mismo contenido alcohlico que los de otra denominacin de origen, por ejemplo la de Toro. Se trata de saber si existe una clara diferenciacin en los mismos ya que, debido a la proximidad geogrfica de ambas regiones, es posible que haya fraudes y se intercambien vinos de ambas dependiendo del mercado de los mismos. La hiptesis de trabajo inicial es entonces Existen diferencias en el grado alcohlico de ambas denominaciones?. Procediendo de la misma manera que en el caso de una poblacin, suponemos una distribucin de probabilidad para la poblacin que es la distribucin Normal. En la primera poblacin (Ribera de Duero) el grado alcohlico sigue una distribucin Normal N(1, "1); en la segunda poblacin (Toro) el grado alcohlico sigue un Modelo Normal N(2, "2). Formulamos a continuacin las hiptesis de trabajo en trminos de los parmetros de los modelos. Las hiptesis nula y alternativa son ahora
H 0 : 1 = 2 Ha : 1 " 2 ( 1 ! 2 = 0) (1 ! 2 " 0)

para el contraste bilateral. Vemos como el contraste de que las medias son iguales es equivalente al contraste de que la diferencia de medias vale 0.

Supongamos que los datos obtenidos son los siguientes para muestras aleatorias

313

de tamao

n1 = 14 y n2 = 6.

Ribera de Duero 12,8 12,8 12,5 11,9 12,5 12,1 12,2 12,6 13,0 12,4 12,6 12,2 12,8 13,0 Toro 13,0 14,0 13,2 13,4 13,2 13,9
Tabla 4.2: Grado alcohlico de 20 vinos de las denominaciones de origen de Ribera y Toro.

Se supone que las muestras se han obtenido de forma independiente en ambas denominaciones. La estadstica descriptiva bsica para ambos grupos aparece en la tabla 4.3.

Tabla 4.3: Descriptiva bsica del grado alcohlico.

Una primera aproximacin a las diferencias entre los dos grupos sera la construccin de grficos comparativos que muestren la estructura de los mismos, por ejemplo, un Box-Plot con los grupos separados. (Ver figura 4.17). Una simple inspeccin visual del grfico nos muestra que hay una clara diferencia entre los grados de ambas denominaciones, a pesar de que la diferencia muestral es muy evidente necesitamos un procedimiento ms formal para establecer si las diferencias observadas pueden ser consideradas estadsticamente significativas. Construiremos el procedimiento de contraste en varios supuestos comenzando desde el ms sencillo hasta los ms complejos.

314

Figura 4.24: Box plot para la comparacin del grado alcohlico de las denominaciones de Ribera y Toro.

4.5.3.2 Varianzas conocidas


Supongamos, para simplificar que las desviaciones tpicas son conocidas, por ejemplo "1 = 0.5 y "2 = 0.6 para las denominaciones de Ribera de Duero y Toro respectivamente. Desarrollaremos el procedimiento general para despus aplicarlo a los datos de los que disponemos. Conocemos la distribucin de la media muestral en ambas poblaciones.
x1 ! N(1, x2 ! N( 2 , "1 ) n1 "2 ) n2

y ambas distribuciones son independientes. El estimador de la diferencia de medias poblacionales ser la diferencia de medias muestrales y, como la diferencia de normales independientes es tambin una distribucin Normal, tenemos que
x1 ! x2 " N(1 ! 2 ,
2 #2 1 + #2 ) n1 n2

315

Estandarizando se obtiene que

Z=

(x1 ! x2 ) ! ( 1 ! 2 )
2 "2 1 + "2 n1 n2

# N(0,1)

Cuando la hiptesis nula es cierta 1 ! 2 = 0 y se tiene que

Z=

(x1 ! x2 )
2 "2 "1 + 2 n1 n 2

# N(0,1)

luego Z ser el estadgrafo de contraste que utilizaremos.

El procedimiento de contraste completo se muestra el cuadro 4.11. Solo se incluye el contraste bilateral ya que la construccin de los correspondientes unilaterales es la misma que en los casos previos y se deja como ejercicio al lector. Hiptesis:
H 0 : 1 = 2 Ha : 1 " 2 ( 1 ! 2 = 0) (1 ! 2 " 0)

Nivel de significacin: ! (x1 ! x2 ) Estadgrafo de contraste: Z = 2 "2 "1 + 2 n1 n 2 Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0, 1) Regin de aceptacin: {Z / Z ! z " / 2 } Regin critica: {Z / Z > z ! / 2 }

Cuadro 4.11: Contraste para la diferencia de medias de dos poblaciones normales con varianza conocida.

Si aplicamos el contraste a los datos del ejemplo, obtenemos los resultados del cuadro 4.12.

316

Hiptesis:

H 0 : 1 = 2 Ha : 1 " 2

( 1 ! 2 = 0) (1 ! 2 " 0)

Nivel de significacin: != 0.05 (5%) 0.01 (1%) (12.529 ! 13.450) Estadgrafo de contraste: Z = = !10.829 0.25 0.36 + 14 6 Valores crticos : para el 5% z0.025= 1,96 para el 1% z0.005= 2,57 Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin crtica, por tanto rechazamos la hiptesis nula. Conclusin no estadstica: La modificacin en el proceso de fabricacin ha aumentado significativamente el grado alcohlico.
Cuadro 4.12: Contraste para la diferencia de medias de dos poblaciones normales con varianza desconocida.

4.5.3.3 Varianzas desconocidas pero iguales


Supongamos ahora que las varianzas son desconocidas pero iguales ("1 = "2 = "). La distribucin de la diferencia de medias muestrales es ahora

Z=

(x1 ! x2 ) ! ( 1 ! 2 ) # N(0,1) 1 1 " + n1 n 2

Tenemos que eliminar el parmetro ", para lo cual utilizaremos las distribuciones muestrales asociadas a las cuasi-varianzas muestrales
2 1 (n1 ! 1)S # $2 n1 !1 2 "

2 (n 2 ! 1)S 2 # $2 n 2 !1 2 "

La suma de dos ji-cuadrado es tambin una ji-cuadrado, sumando las dos anteriores

2 (n ! 1)S 2 (n ! 1)S 2 + (n ! 1)S 2 (n1 ! 1)S 1 + 2 2 = 1 1 2 2 # $2 n1 + n 2 ! 2 2 2 2 " " "

317

Suponiendo que ambas distribuciones son independientes* , podemos combinarlas para obtener una distribucin t de Student. La variable aleatoria

t=

(x1 ! x 2 ) ! (1 ! 2 ) 1 1 " + n1 n 2
2 + (n ! 1)S 1 2 (n1 ! 1)S 2 2 "2

n1 + n2 ! 2

(x1 ! x2 ) ! (1 ! 2 ) 1 + 1 S n1 n2

= con S

2 + (n ! 1)S 1 2 (n1 ! 1)S 2 2 sigue una t de Student con n + n - 2 grados de 1 2 n1 + n 2 ! 2

libertad. Si la hiptesis nula es cierta, el estadgrafo de contraste que utilizaremos es

t=

(x1 ! x2 ) = t n1 + n 2 ! 2 1 1 S + n1 n 2

Es posible considerar un estadgrafo de contraste alternativo si se utilizan las varianzas muestrales en lugar de las cuasi-varianzas. Para ello basta tener en cuenta que las distribuciones muestrales asociadas a las varianzas son
2 n1 S1 2 2 " # n1 $ 1 !

n2 S 2 2 2 2 " #n 2 $1 !

El nuevo estadgrafo de contraste es de la forma

t=

(x1 ! x2 ) = t n1 + n 2 ! 2 1 1 S + n1 n 2

con S =

2+n S 1 2 n1 S 2 2 . Los dos estadsticos toman exactamente el mismo valor por lo n1 + n2 ! 2

que pueden utilizarse indistintamente. Usaremos el calculado a partir de las cuasivarianzas porque son estimadores insesgados de la varianza poblacional.
*

La demostracin puede encontrarse en cualquier libro de Estadstica Matemtica. No se ha incluido aqu porqwue supera los propsitos de este trabajo.

318

En ambos casos lo que se ha hecho es estimar la varianza comn de ambas poblaciones mediante una media ponderada de las varianzas estimadas en cada poblacin, y se ha cambiado la distribucin Normal por la t de Student con el correspondiente aumento en la dispersin que hace que sea ms difcil encontrar diferencias. En este caso es necesario que las varianzas sean iguales para poder despejarlas y eliminarlas en el clculo del estadgrafo de contraste. La comprobacin de la igualdad de varianzas se har posteriormente aunque sea un paso previo a la decisin del tipo de contraste. Las cuestiones relacionadas con la potencia del contraste se interpretan de la misma manera que en todos los casos anteriores. Cuanto mayor sea la diferencia que queremos detectar mayor ser la potencia para detectarla. Cuanto ms pequeo sea el efecto que queremos detectar mayor ser el tamao de muestra necesario para hacerlo. Si aumentamos indefinidamente el tamao muestral conseguiremos que la diferencia muestral sea siempre estadsticamente significativa por pequea que sea. El contraste completo se muestra en el cuadro 4.13.
H0 : 1 = 2 ( 1 ! 2 = 0) Ha : 1 " 2 (1 ! 2 " 0) Nivel de significacin: ! (x1 ! x2 ) (x1 ! x 2 ) t= Estadgrafo de contraste: t = 1 1 1 + 1 S S + n1 n 2 n1 n 2

Hiptesis:

2 + (n ! 1)S 1 2 2 2 (n1 ! 1)S 2 2 S = n1 S1 + n2 S 2 n1 + n 2 ! 2 n1 + n2 ! 2 Distribucin del estadgrafo cuando la hiptesis nula es cierta: t de Student t n1 +n 2 !2

= con S

Regin de aceptacin: t / t ! t n1 + n 2 " 2, # Regin critica: t / t > t n1 + n 2 ! 2, "

Cuadro 4.13: Contraste para la diferencia de medias de dos poblaciones normales con varianzas desconocidas pero iguales.

El contraste se ha aplicado a los datos del ejemplo inicial y se han obtenido los siguientes resultados (ver cuadro 4.14).

319

H0 : 1 = 2 ( 1 ! 2 = 0) Ha : 1 " 2 (1 ! 2 " 0) Nivel de significacin: != 0.05 (5%) 0.01 (1%) (12.529 ! 13.450) Estadgrafo de contraste: t = = !5.256 1 1 0.359 + 14 6 Valores crticos : para el 5% t18,0.025= 2.101 para el 1% t18,0.005= 2.878

Hiptesis:

Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin crtica, por tanto rechazamos la hiptesis nula. Conclusin no estadstica: El grado alcohlico es significativamente diferente en Ribera de Duero y Toro.
Cuadro 4.14: Contraste para la diferencia de medias de dos poblaciones normales con varianzas desconocidas pero iguales, aplicado a los datos sobre el grado alcohlico.

4.5.3.4 Varianzas desconocidas y distintas


Supongamos ahora que las varianzas son desconocidas y distintas ("1 " "2) de forma que ya no es posible eliminar el parmetro en el clculo de la t de Student. Se han propuesto diversas aproximaciones para la aproximacin de la distribucin del estadgrafo de contraste. Describiremos aqu la aproximacin de Welch (ver cuadro 4.15). La demostracin completa est fuera de los propsitos de este trabajo.
H0 : 1 = 2 ( 1 ! 2 = 0) Ha : 1 " 2 (1 ! 2 " 0) Nivel de significacin: ! 2 S 1 2 S Estadgrafo de contraste: t = (x1 ! x2 ) + 2 n1 n2 Distribucin del estadgrafo cuando la hiptesis nula es cierta: t de Student tf donde f es el entero ms prximo a 2 2 !S 1 2 $ S 2 # + & " n1 n 2 % f= '2 2 $ 2 ! S 2 $ 2 !S # 1& # 2& " n1 % " n2 % + n1 + 1 n 2 + 1

Hiptesis:

Regin de aceptacin: {t / t ! t f," } Regin critica: {t / t > t f, ! }

Cuadro 4.15: Contraste para la diferencia de medias de dos poblaciones normales con varianzas desconocidas y distintas.

320

4.5.3.5 Contrastes de comparacin de medias para muestras grandes


Como ya se coment para el caso de una nica poblacin, el teorema central del lmite permite asignar distribuciones normales a las medias muestrales aunque la distribucin en la poblacin no sea Normal. Si disponemos de una muestra de tamao grande y estimamos la varianza poblacional a travs de la cuasi-varianza muestral, podemos construir un contraste aproximado de comparacin de medias utilizando la distribucin Normal (ver cuadro 4.16).
H0 : 1 = 2 ( 1 ! 2 = 0) Ha : 1 " 2 (1 ! 2 " 0) Nivel de significacin: ! 2 S 1 2 S Estadgrafo de contraste: t = (x1 ! x2 ) + 2 n1 n2

Hiptesis:

Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1) Regin de aceptacin: {Z / Z ! z " / 2 } Regin critica: {Z / Z > z ! / 2 }

Cuadro 4.16: Contraste para la diferencia de medias de dos poblaciones normales con varianzas desconocidas y tamaos muestrales grandes.

Obsrvese que estamos suponiendo implcitamente que la cuasi-varianza muestral es un buen estimador de la varianza poblacional, prximo al verdadero valor.

4.5.3.6 Obtencin de datos para la comparacin de medias.


Dos son los tipos de datos de los que es posible disponer para la comparacin de las medias - Datos procedentes de estudios observacionales. - Datos procedentes de estudios experimentales. En el primer caso se toman muestras aleatorias en dos poblaciones. La muestra aleatoria garantiza la representatividad . A este tipo de datos corresponde el ejemplo que hemos utilizado como gua para la explicacin.

321

Los datos experimentales se corresponden con experimentos planificados en los que se asignan dos tratamientos distintos a un grupo de individuos. En este tipo de diseos es necesario que todas las caractersticas que no intervienen en el diseo y puedan modificar la respuesta, estn controlados y sean similares en los dos grupos a comparar. Por ejemplo, si se desea hacer un ensayo clnico en el que se dispone de un grupo de pacientes de forma que a un subconjunto se le aplicar el tratamiento a comparar y el resto ser utilizado como control sobre el que se utilizar un placebo (substancia no activa) con la misma apariencia que el tratamiento, los pacientes de ambos grupos han de ser similares en composicin con respecto a caractersticas como la edad peso u otros factores que pudieran alterar la respuesta y que no intervienen directamente en el diseo. Se tratar de evitar sesgos de forma que los efectos puedan ser asignados a los tratamientos, por ejemplo, en un experimento con ratones de laboratorio en el que se dispone de dos camadas distintas, no sera correcto asignar un tratamiento diferente a cada una de las camadas ya que sera imposible separar los efectos del tratamiento y de la camada. En Estadstica decimos que los tratamientos estn confundidos. La forma de asignar tratamientos a individuos para que no existan errores sistemticos es hacerlo al azar, por ejemplo, sorteando cual es el tratamiento que se aplica a cada individuo. A este procedimiento se le denomina aleatorizacin, y juega un papel fundamental en el diseo de experimentos planificados. Hay que hacer notar que al azar no significa "de cualquier manera" o "cualquiera de los tratamientos", para conseguir una verdadera aleatorizacin es necesario utilizar la probabilidad. En los experimentos diseados es muy importante realizar estudios previos sobre el tamao de muestra necesario para detectar un determinado efecto. Este problema est fuera del alcance de un curso introductorio aunque las ideas bsicas fueron expuestas cuando se trat con los intervalos de confianza. Este tipo de experimentos se comenz en Agricultura para extenderse despus a otras aplicaciones como la Industria o la Medicina. Actualmente los ensayos clnicos controlados, basados fundamentalmente en conceptos de Estadstica, forman una parte importante de la investigacin mdica. Todo el mundo ha odo alguna vez en las noticias los resultados de ensayos clnicos controlados antes de lanzar al mercado un nuevo medicamento.

322

4.5.3.7 Contraste para datos apareados.


En el caso de datos independientes en el punto anterior, se dispone de dos conjuntos distintos de individuos para cada una de las situaciones experimentales que se quiere compara. Una forma de controlar la variabilidad debida a los propios sujetos consiste en aplicar todos los tratamientos en estudio a todos los individuos de la muestra en dos ocasiones diferentes. A este tipo de datos lo denominaremos datos apareados, relacionados, o ligados y consisten en dos medidas tomadas sobre el mismo conjunto d individuos en dos ocasiones diferentes. Para ilustrar los procedimientos utilizaremos datos tomados de MARTN ANDRS y LUNA CASTILLO (1990). Supongamos que deseamos saber si la presin sistlica de personas alcohlicas se modifica cuando dejan el hbito de beber, para ello se toma una muestra de 10 personas que ingresan en el hospital para tratar su alcoholismo y se toma una medida de la presin sistlica antes y despus de dos meses de haber dejado de beber. El experimento fue diseado de esta manera ya que aunque se espera una reduccin en la presin sangunea, esta depende del valor inicial en cada individuo. Los resultados obtenidos para la presin sistlica medida en milmetros de mercurio fueron los siguientes (tabla 4.4): Individuo Antes Despus Reduccin 1 140 145 -5 2 165 150 15 3 160 150 10 4 160 160 0 5 175 170 5 6 190 175 15 7 170 160 10 8 175 165 10 9 155 145 10 10 160 170 -10

Tabla 4.4: datos utilizados en el ejemplo de contraste para datos apareados

Como las variables estn relacionadas, todos los clculos que realizamos en el caso de datos independientes ya no son vlidos. Para evitar este problema nos centraremos en una sola variable aleatoria que es la diferencia entre los dos valores obtenidos para cada uno de los individuos estudiados que mide el efecto del tratamiento aplicado. Tenemos ahora una nueva variable D que suponemos que tiene una distribucin Normal de media d desviacin tpica "d . La hiptesis de inters es ahora que, en promedio, el tratamiento aplicado a los individuos es 0, es decir, d = 0. El contraste es ahora exactamente igual que el descrito para la media de una poblacin Normal (ahora la poblacin de las diferencias.

323

Describimos a continuacin el contraste para muestras pequeas y varianza desconocida para datos apareados. Llamaremos d , a la media muestral de las a la cuasi desviacin tpica. El contraste se muestra en el cuadro 4.17. diferencias y S d

Hiptesis:

H0 : d = 0 H a : d ! 0
d

Nivel de significacin: ! Estadgrafo de contraste: t = Sd

n Distribucin del estadgrafo cuando h0 es cierta: tn-1 Regin de aceptacin: {t / t ! t n "1, # }


Regin critica: {t / t > t n !1, " }

Cuadro 4.17: Contraste para la diferencia de medias de dos poblaciones normales con datos apareados.

El resto de los contrastes se construye de la misma manera que en el caso de una sola poblacin. El cuadro 4.18 muestra ejemplo.

Hiptesis:

H0 : d = 0 H a : d ! 0

Nivel de significacin: 5% y 1% 6 = 2.250 Estadgrafo de contraste: t = 8.433 10 Distribucin del estadgrafo cuando h0 es cierta: t9 Valores crticos : para el 5% t9, 0.05= 2,262 para el 1% t9, 0.01= 3,250 p-valor : 0,0510 Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de aceptacin, por tanto aceptamos la hiptesis nula. Conclusin no estadstica: Con los datos de los que disponemos no existe una evidencia significativa de que exista una diferencia entre la presin sistlica antes y despus de haber dejado de beber.
Cuadro 4.18: Contraste para la diferencia de medias de dos poblaciones normales con datos apareados aplicado al ejemplo de la reduccin de la tensin arterial en alcohlicos.

324

4.5.3.8 rbol de decisiones para la comparacin de medias de dos poblaciones normales.


La figura siguiente muestra de forma esquemtica el proceso de decisin por el tipo de contraste a utilizar en poblaciones normales.

325

4.5.3.9 Contraste para la comparacin de la tendencia central cuando las poblaciones no son normales
En muchas situaciones prcticas es difcil aceptar la hiptesis previa de que los datos son normales al disponerse, por ejemplo, de distribuciones muy asimtricas. En estos casos los contrastes anteriores no detectan claras diferencias en el comportamiento de las poblaciones, debido a que la dispersin es muy grande o debido a que la medida de tendencia central utilizada (la media) no es la correcta porque est afectada por los valores extremos. Los contrastes paramtricos descritos antes son especialmente sensibles a valores extremos de la variable. Para solucionar el problema se utiliza la mediana en lugar de la media construyndose los que se denominan contrastes no paramtricos al no referirse ya a parmetros de una distribucin concreta.

Me1

x1

x2

Me2

En la figura se muestra como para distribuciones asimtricas es mucho ms intuitiva la comparacin de las medianas que la comparacin de las medias, ya que estas estn afectadas por los valores muy extremos de la distribucin. La situacin del esquema es muy tpica, por ejemplo, en problamas mdicos en los que la mayora de los controles (curva de la izquierda) presentan valores normales de la variable, y solamente algunos de ellos presentan valores elevados, en el grupo de los pacientes enfremos, la mayora presenta valores elevados y solamente alguno presenta valores normales. El problema es particularmente crtico cuando el tamao de muestra es pequeo pero, incluso cuando el tamao de muestra es grande y se utiliza errneamente el contraste paramtrico

326

correspondiente, se subestima el tamao del efecto a pesar de que la distribucin normal est correctamente utilizada aplicando el Teorema Central del lmite. La prctica habitual, especialmente en el mbito mdico, de aplicar contrastes no paramtricos cuando la muestra es pequea y paramtricos cuando es grande es claramente errnea y puede llevar a no encontrar efectos experimentales que aparecen claramente definidos en los datos. Para la comparacin de medianas de dos poblaciones con datos independientes el contraste ms utilizado es el conocido como U de Mann-Withney, est basado en la suma de los rangos de orden de las observaciones de las dos poblaciones consideradas conjuntamente y consiste bsicamente en calcular todas las ordenaciones posibles con muestras de los mismos tamaos en el caso de que las medianas fueran iguales, para comprobar el percentil en el que se encuentra nuestro caso particular. Cabe esperar que si las medianas de las dos poblaciones son iguales los datos estn mezclados y las sumas de rangos de orden sean similares en amos grupos. El resto del razonamiento es similar al de cualquier contraste, si el valor muestral obtenido es muy probable aceptamos la hiptesis nula y si no la rechazamos. Para el caso de datos apareados se utiliza el test de Wilcoxon que contrasta la hiptesis de que la mediana de las diferencias es cero. La base del contraste es similar al caso de muestras independientes.

Comparacin de medianas de dos poblaciones con datos independientes: el contraste U de Mann-Withney Est basado en la suma de los rangos de orden de las observaciones de las dos poblaciones consideradas conjuntamente y consiste bsicamente en calcular la distribucin muestral a partir de todas las ordenaciones posibles con muestras de los mismos tamaos en el caso de que las medianas fueran iguales. Cabe esperar que si las medianas de las dos poblaciones son iguales los datos estn mezclados y las sumas de rangos de orden sean similares en ambos grupos.

327

HIPOTESIS:

H 0 : Me1 = Me 2 H a : Me1 " Me 2

(Me 1 ! Me 2 = 0) (Me 1 ! Me 2 " 0)

ESTADIGRAFO DE CONTRASTE: Ordenar las observaciones, asignar el rango correspondiente y calcular las sumas de rangos de las observaciones de cada grupo.(R1 y R2)

n (n + 1) U = min(U 1 , U 2 ) U i = n 1n 2 + i i ! Ri 2
Para muestras grandes: Z =

n n U! 1 2 2 n 1 n 2 (n 1 + n 2 + 1) 12

DISTRIBUCION DEL ESTADIGRAFO CUANDO H0 ES CIERTA: Distribucin emprica o N(0,1) para muestras grandes. REG. DE ACEP.:

inf {U / U! ;n ,n

1 2

REGION CRITICA:

sup ; U {U / U ![U inf ";n ,n ";n ,n ]}


1 2 1 2

" U " U !;n ,n 1 2

sup

{Z /

Z ! z " /2 }

{Z /

Z > z ! /2 }

Comparacin de medianas de dos poblaciones con datos apareados: el test de Wilcoxon Contrasta la hiptesis de que la mediana de las diferencias es cero. La base del contraste es similar al caso de muestras independientes.

HIPOTESIS:

H 0 : Me d = 0 H a : Me d ! 0

ESTADIGRAFO DE CONTRASTE: Calcular las diferencias entre los valores de ambos grupos, Suprimir las observaciones nulas, Ordenar las observaciones en valor absoluto, asignar el rango correspondiente y calcular las sumas de rangos de las observaciones positivas y negativas.(T+ y T-)

T = min(T+ , T! )

328

Para muestras grandes: Z =

n(n + 1) 4 n(n + 1)(2n + 1) 24 T!

DISTRIBUCION DEL ESTADIGRAFO CUANDO H0 ES CIERTA: Distribucin

sup {T / T!inf ;n " T " T! ;n } sup inf REGION CRITICA: {T / T ![T";n ; T" ;n ]}
REG. DE ACEP.:

emprica o N(0,1) para muestras grandes.

{Z /

Z ! z " /2 } Z > z ! /2 }

{Z /

4.5.3.10 Comparacin de varias poblaciones. Introduccin al problema de las comparaciones mltiples.


En muchas situaciones experimentales se dispone de r >2 poblaciones a comparar. La primera aproximacin al problema es la comparacin de todas la parejas de medias, sin embargo, la propia construccin del procedimiento de contraste hace que la probabilidad de error no se mantenga al realizar todas las comparaciones por parejas. Supongamos que disponemos de r poblaciones y queremos contrastar la hiptesis de que todas las medias son iguales

H 0 : 1 = = i = = r
La hiptesis es cierta si y solo si las hiptesis por parejas H0 : i = j para todas ! r $ r(r & 1) las k = # = combinaciones posibles de i y de j. " 2% 2 Si contrastamos la hiptesis por separado a un nivel de significacin !, tenemos
P(Aceptar
j i, j H i, 0 / H0

i, j

cierta ) = 1 ! "

Si las comparaciones fueran independientes

329

P(Aceptar

H0 / H0

cierta ) = P( ! Aceptar
i!j

j Hi, 0 / H0

cierta ) =

i!j

j i,j cierta ) = (1 # $ )k " P(Aceptar Hi, 0 / H0

es decir, la probabilidad de cometer un error tipo I es


P(Re chazar = 1 ! P(Aceptar H0 / H0 / H0 H0 cierta ) =

cierta ) = 1 ! (1 ! " ) k # "

Por ejemplo, para tres poblaciones en las que se realizan comparaciones 3 individuales al 5%, hay una probabilidad de 1 ! 0.95 = 1 ! 0.8574 = 0.1426 de rechazar la hiptesis nula indebidamente. Con 5 poblaciones la probabilidad sera 1 ! 0.9510 = 1 ! 0.5987 = 0.4013 . Con 10 poblaciones 1 ! 0. 95

45

= 1 ! 0. 0994 = 0. 9006 , es decir, con 10

poblaciones, aunque todas las medias fueran iguales tendramos una probabilidad del 90% de encontrar diferencias en alguna de las parejas. Este problema es importante no solo en la comparacin de medias por parejas sino tambin cuando se quieren realizar muchas comparaciones sobre el mismo conjunto de datos. Supongamos, por ejemplo, que un investigador desea demostrar que es capaz de encontrar diferencias entre personas convictas por algn tipo de delito y personas que no. A tal fin realiza 100 medidas biomtricas como el permetro torcico, el permetro craneal, etc.... que compara en los dos grupos. En cada comparacin tiene una probabilidad del 5% de rechazar indebidamente, sin embargo (si las medidas fueran independientes) tendra una probabilidad del 99,41% de encontrar diferencias en alguna de las variables. El nmero esperado de contrastes significativos sera de 5.

El problema de mantener el nivel de significacin global en la comparacin de las medias de varios grupos se soluciona mediante la tcnica denominada Anlisis de la varianza seguido de las comparaciones por parejas en las que se hace algn tipo de correccin en el nivel de significacin individual.

330

4.5.3.11 Validacin de las hiptesis de partida.


A lo largo de los distintos puntos de la descripcin de los contrastes bsicos hemos ido haciendo una serie de suposiciones que no hemos verificado como son las hiptesis de normalidad o de igualdad de varianzas (homocedasticidad) de las poblaciones. La validacin de estos supuestos se ha dejado para el final aunque debe realizarse previamente a la aplicacin de los procedimientos de contraste. Existen muchos mtodos que permiten la validacin de la hiptesis de normalidad, desde los ms formales consistentes en nuevos contrastes cuya hiptesis nula es la hiptesis de que los datos proceden de una distribucin Normal, hasta simples procedimientos descriptivos como el histograma o el Box-Plot que nos permiten decidir si la distribucin es aproximadamente simtrica o Normal y si la dispersin de los grupos en estudio es aproximadamente la misma. Los procedimientos de contraste de comparacin de medias suelen ser robustos con respecto a la hiptesis de normalidad aunque muy sensibles a la presencia de outliers (datos anormalmente grandes o pequeos). En las representaciones Box-plot de los grupos a comparar buscaremos la simetra de lo grupos y, sobre todo, la presencia de observaciones extraas en los extremos de la distribucin. La figura 4.19 muestra el grfico con los Box-Plots correspondientes al ejemplo de las denominaciones de origen, que hemos analizado previamente

Figura 4.26: Box plot para la comparacin del grado alcohlico de las

331

denominaciones de Ribera y Toro.

El grfico muestra como no hay observaciones muy extremas, las dos distribuciones tienen aproximadamente la misma dispersin y la correspondiente a la denominacin de origen de Toro parece ms asimtrica. La asimetra podra ser debida simplemente a que el tamao muestral es muy pequeo en este grupo. En lneas generales parece que las hiptesis se verifican y es posible aplicar el contraste par la igualdad de medias de dos poblaciones normales con varianzas desconocidas pero iguales. Para contrastar ms formalmente que las varianzas son iguales se puede construir un contraste muy simple teniendo en cuenta la distribucin del cociente de varianzas basado en el cociente de las distribuciones ji-cuadrado asociadas. El cociente

(n1 ! 1) 2 "1 (n1 ! 1) F == 2 (n 2 ! 1)S 2 "2 2 (n2 ! 1)

2 S "2 1 = 2 2 2 S2 "1

sigue una distribucin F de Snedecor con n1-1 y n2-1 grados de libertad.


2 Si la hiptesis nula H0 : !1 = !2 2 es cierta, el cociente de cuasi-varianzas 2 S muestrales F = 1 sigue una distribucin F de Snedecor con n1-1 y n2-1 grados de 2 S

libertad.

332

El contraste completo aparece en el cuadro 4.19.


2 H0 : !1 = !2 2

2 Ha : !1 " !2 2 Nivel de significacin: !

Hiptesis:

2 S Estadgrafo de contraste: F = 1 2 S 2 Distribucin del estadgrafo cuando h0 es cierta: F n1 !1, n 2 !1


Regin critica: F / F ![Fn 1 "1,n2 "1, 1"# / 2 ,F n1 " 1,n 2 "1, 1"# / 2 ]

Regin de aceptacin: F / F ![Fn 1 "1,n2 "1, 1"# / 2 ,F n1 " 1,n 2 "1, 1"# / 2 ]

Cuadro 4.19: Contraste de comparacin de las varianzas de dos poblaciones normales.

Para el ejemplo de la comparacin del grado alcohlico en las dos denominaciones de origen consideradas el contraste de comparacin de varianzas se muestra en el cuadro 4.20. Hiptesis:
2 H0 : !1 = !2 2 2 " !2 Ha : !1 2

Nivel de significacin: ! = 5% y 1% 2 1 S Estadgrafo de contraste: F = 2 = 0.686 S


2

Distribucin del estadgrafo cuando h0 es cierta: F n1 !1, n 2 !1 p-valor : 0.6261 Conclusin : Se acepta la hiptesis nula.
Cuadro 4.20: Contraste de comparacin de las varianzas de dos poblaciones normales aplicado a la comparacin de la variabilidad del grado alcohlico.

Como se acepta la hiptesis de igualdad de varianzas, la comparacin de medias ha de hacerse en el supuesto de que las varianzas son iguales.

El valor F n ! 1,n !1, 1!" /2 es el valor crtico que deja a la derecha un rea de 1 ! " / 2 . En la 1 2 prctica puede calcularse como F n ! 1,n !1, 1!" /2 = 1 F n ! 1, n ! 1, " / 2 1 2 2 1
*

333

Quinta Unidad Didctica

"TABLAS DE CONTINGENCIA"

5.1 Parte bsica

334

5.1.1 Introduccin
La existencia de distintas pruebas estadsticas es consecuencia, en parte, de las distintas escalas de medida que se utilizan para tratar las variables objeto de una determinada investigacin. Los investigadores de distintos campos utilizan de modo habitual variables medidas en escala nominal y pasan buena parte de su tiempo clasificando y contando individuos. As por ejemplo cualquier individuo puede ser clasificado en categoras (varn, mujer; enfermo, sano; ausencia, presencia; soltero, casado, viudo, separado). El resultado de tales clasificaciones da lugar a lo que en la terminologa estadstica se le conoce como tablas de contingencia o tablas de frecuencias. Tablas de contingencia son tablas de variables aleatorias cualitativas cuyos datos estn recogidos en forma de tablas de frecuencias.

El objetivo de este captulo es:


El estudio de diversas cuestiones en relacin a variables aleatorias cualitativas cuyos datos estn recogidos en forma de tablas de frecuencias: Tablas de contingencia. En esencia se pueden a abordar varios tipos de problemas:

1) Test de bondad de ajuste a distribuciones: Para comprobar si nuestros datos muestrales se ajustan a un determinado modelo terico. (Ejemplo: Sigue la estatura media de los espaoles una ley normal?) 2) Test de homogeneidad de varias muestras cualitativas: Contraste para probar si varias muestras de un carcter cualitativo proceden de igual poblacin. (Ejemplo: Es la proporcin de parados en Espaa la misma que en el resto de los pases Europeos?)

335

3) Test de asociacin: Para comprobar si dos o mas caractersticas cualitativas estn relacionadas entre s. (Ejemplo: Est la intencin de voto, a un determinado partido poltico, relacionada con el sexo?).
En el desarrollo del captulo nos vamos a centrar en este ltimo tipo de contrastes.

5.1.2 Nociones generales tiles para su resolucin


El denominador comn a estos objetivos es que su tratamiento estadstico est basado en la misma distribucin terica: la distribucin Ji- cuadrado. El test ji-cuadrado es el estadstico ms apropiado para variables categricas. Antes de comenzar al desarrollo de los contrastes sealados hemos de sentar unas ideas que nos permitirn abordar el estudio con mayor facilidad de comprensin. En toda tabla de contingencia (sea cual sea el objetivo perseguido) podemos distinguir varios elementos comunes: Frecuencias observadas: nmero de individuos de nuestra muestra que pertenece a una de las categoras en las que hemos dividido a nuestra variable aleatoria (Oi). Frecuencias esperadas: Nmero de individuos en nuestra muestra que cabra esperar en cada categora si alguna hiptesis nula de partida fuera cierta (Ei).

EJEMPLO 5.1: Supongamos una muestra de 100 individuos de una poblacin en los que estamos estudiando el estado civil. Esta variable aleatoria puede tener cuatro categoras: soltero, casado, viudo y divorciado. Supongamos que el nmero de individuos en

336

nuestro estudio ha sido: 50 casados, 30 solteros, 15 viudos y 5 divorciados, estos nmeros representan nuestras frecuencias observadas. Solucin: Nuestra hiptesis de partida (H0) podra ser que las cuatro categoras estn igualmente representadas. En este caso cabra esperar que nuestra muestra constara de 25 individuos en cada casilla, que se corresponden con nuestras frecuencias esperadas.
Solteros frecuencia Observada frecuencia Esperada 25 25 25 25 30 Casados 50 Viudos 15 Divorciados 5

Est claro que si nuestra H0 entonces un problema:

fuera cierta las frecuencias observadas y las

esperadas discreparan poco y, seran muy diferentes en caso contrario. Se nos plantea

Cmo medir las discrepancias?. La forma ms simple de medir divergencias entre ambas magnitudes sera efectuar la diferencia entre ambas (foi -fei ), en todas y cada una de las casillas de la tabla y, obtener, de este modo, una magnitud que: si es grande nos har pensar en rechazar la hiptesis de partida, y si es pequea en aceptarla.
En realidad el estadstico con el que vamos a trabajar se basa en esta idea, si bien tiene algunas correcciones (no trabaja con diferencias sino con diferencias al cuadrado, para evitar problemas de signos, y trabaja con discrepancias normalizadas, obtenindolas en valores relativos).

Estadgrafo de contraste:

!2 = #
i

(fo i " fe i )2
fei

foi= Frecuencia observada para la i-sima categora fei= Frecuencia esperada para la i-sima categora

337

El siguiente problema que se nos plantea: qu entendemos por magnitud grande? Necesitamos un criterio uniforme para declarar rechazos o aceptaciones. Pearson nos soluciona este problema demostrando que el estadgrafo de contraste propuesto segua un modelo terico: Una Ji-cuadrado con (r-1)(s-1) grados de libertad, cuando la hiptesis nula se verificaba. (Siendo r= n de filas de la tabla y s= n de columnas de la tabla). De este modo el criterio de decisin ya est establecido, declararemos rechazo, es decir declararemos diferencias grandes, cuando nuestro valor del estadgrafo experimental supere al valor crtico encontrado en la tabla de la distribucin Ji-cuadrado con esos grados de libertad, al nivel de significacin elegido.
Recurdese que un valor crtico no es ms que un valor de la variable aleatoria que slo es superado por un porcentaje pequeo, preestablecido de antemano, de individuos cuando la hiptesis nula es cierta

5.1.3 Test de asociacin en tablas de contingencia


Es frecuente el problema de estudiar conjuntamente dos variables en los mismos individuos y preguntarse si existe algn tipo de relacin entre ellas, es decir si los valores que tome una de ellas van a condicionar de algn modo los valores que tome la otra. Cuando las dos variables son cuantitativas hemos visto que son las tcnicas de regresin y correlacin las que nos permiten resolver el problema, pero estas tcnicas dejan de ser vlidas cuando las dos variables en estudio son cualitativas. Este apartado pretende dar solucin a dicha situacin. Para resolver este problema vamos a explicarlo mediante un ejemplo.

338

EJEMPLO 5.2: Supongamos cuatro tratamientos (Ai) que se piensa efectivos para curar una determinada enfermedad, estos tratamientos se aplican a enfermos de dicha enfermedad y se anota el tipo de respuesta que presentan (Bj). La respuesta se clasifica en tres posibles clases: "peor", "igual", "mejor". Ejemplo tomado de MARTN ANDRS, A. et al. (1995).

Peor Trat 1 Trat 2 Trat 3 Trat 4 TOTAL 7 f11

Igual 28 f12 20 f22 30 f32 40 f42 118 f.2

mejor 115 f13 85 f23 90 f33 115 f43 405 f.3

TOTAL 150 f1. 120 f2. 130 f3. 160 f4. 560 f..

15 f21 10 f31 5 f41

37 f .1

fi. = Total fila i f.j = Total columna j f.. = Gran total Solucin: Disponemos de nuestra tabla de frecuencias observadas, se necesita establecer una hiptesis de partida que nos permita el clculo de las correspondientes frecuencias esperadas. La hiptesis de la que se parte es la hiptesis de independencia, es decir vamos a suponer que ambos caracteres no estn relacionados (no estn asociados). Si denotamos: Ai= Suceso de que un individuo pertenezca a la clase i de A Bj= Suceso de que un individuo pertenezca a la clase j de B Podemos escribir las hiptesis como: Ho: Los caracteres A y B son independientes bien los caracteres A y B no estn relacionados los caracteres A y B no estn asociados Ha: Son dependientes, relacionados, asociados

339

En nuestro ejemplo: Ho: El tipo de tratamiento no condiciona la respuesta del individuo. Ha: Si condiciona.

Si ambas caractersticas son independientes podemos escribir las hiptesis de la siguiente forma:

( ) ( ) Ha:P( Ai ! Bj ) # P( Ai ) P( Bj ) en alguna ocasin


Ho:P Ai ! B j = P(A i ) P B j "i, j
Es decir bajo el supuesto de independencia, y slo en este supuesto, la probabilidad de la interseccin de dos sucesos es el producto de probabilidades de ambos sucesos Obtencin de las feij: Como en todo test Ji-cuadrado necesitamos las cantidades esperadas bajo el supuesto de que H0 se verifique. Fijmonos en una cualquiera de ellas por ejemplo en la E21: Cantidad de individuos que habiendo recibido el tratamiento 2 empeoran supuestas ambas independientes. Si Ho es cierta:

fe 21 = f .. P(A2 )P(B1 )

Para su clculo necesitamos P(A2) , es decir la probabilidad de los individuos a recibir el tratamiento 2, y la P(B1) es decir la probabilidad de los individuos de empeorar. Ntese que en la frmula aparecen, ademas de estas dos probabilidades el total global. El total global es necesario para pasar de probabilidades a frecuencias Ambas probabilidades son desconocidas pero estimables a partir de la tabla (casos favorables entre casos totales). A los correspondientes estimadores de las ij probabilidades les vamos a denotar con: p

p(A2 ) =
p(B1 ) =

120 f 2. = 560 f..


37 f.1 = 560 f ..

340

f 2. f.1 f 2. f .1 (A ) P fe 21 = f .. P = = 7.93 2 (B1 ) = f .. f.. f .. f ..

De donde se desprende la regla general que nos permitir calcular la frecuencia esperada de cualquiera de las casillas de la tabla: feij= (Total fila i-sima)(Total col. j-sima)/Total global Sin ms que aplicar esta frmula general obtendremos la tabla de frecuencias esperadas:
Peor 7 9.91 15 7.93 10 8.59 5 10.57 37 Igual 28 31.61 20 25.28 30 27.39 40 33.72 118 mejor 115 108.48 85 86.79 90 94.02 115 115.71 405 TOTAL 150 120 130 160 560

Trat 1 Trat 2 Trat 3 Trat 4 TOTAL

Obtencin de la cantidad experimental: Para medir las discrepancias entre ambas utilizamos el estadgrafo de contraste adecuado que como veamos era:

!2 exp =

##
i j

( foij " fe ij)


fe ij

En nuestro ejemplo concreto este valor resulta ser:


2 ! exp

(7 " 9.91)2
9. 91

+ ... +

(115 " 115. 71)2


15. 71

= 13.87

Ya sabemos que valores grandes nos llevaran a rechazar la hiptesis de independencia, y los pequeos a aceptarla. Sabemos tambin que la regla de decisin est clara pues basta con buscar el valor crtico en la tabla de la Ji-cuadrado ( con los grados de libertad adecuados, y al nivel de significacin deseado, 5% por ejemplo), y

341

comparar nuestro valor experimental con l. Declararemos significacin siempre que el valor experimental supere el valor crtico.
2 2 o ! exp " " # !$ ,%
2 ! 0. 05,6 = 12. 59

! = (r " 1)(s " 1) = 2x3 = 6

12.59<13.87 , por tanto Rechazo Ho En nuestro caso concreto son 6 los grados de libertad y 12.59 el valor crtico. El valor experimental, 13.87, supera al valor crtico. Conclusin: El tipo de tratamiento condiciona el tipo de respuesta encontrada en el paciente. No podemos suponer independencia de las dos variables en estudio.

En resumen, los pasos a seguir en este tipo de anlisis son:

1 Clculo individual de las frecuencias esperadas que cabra esperar si H0 fuera cierta. La hiptesis de la que partiremos es siempre la de independencia entre las dos variables, ya que slo bajo este supuesto conocemos la distribucin del estadgrafo de contraste (distribucin ji-cuadrado de Pearson) 2 2 Clculo de los componentes individuales de ! , es decir clculo de las divergencias entre observadas y esperadas para cada casilla. 3 Suma de los valores obtenidos en el apartado anterior y obtencin , de esta forma, del valor experimental de nuestro estadgrafo de contraste. 4 Determinacin de los grados de libertad de la forma (r-1)(s-1) 2 5 Obtencin del valor crtico en la tabla de la distribucin ! con los grados de libertad correspondientes y decidir si el estadstico calculado en el paso 3 excede este valor crtico con p=0.05 o bien con p=0.01 6 Concluir en consecuencia. Es decir, hablar de que existe o no asociacin entre ambas variables segn el valor experimental exceda o no al valor crtico.

342

"TABLAS DE CONTINGENCIA" 5.2 Ampliacin

343

5.2.1 Aspectos de inters.


5.2.1.1 Tipo de contraste
- Se trata de un contraste unilateral superior y esto es as siempre que trabajemos con tablas de contingencia (sea cual sea el objetivo a cubrir), se debe a la forma del estadgrafo empleado. Si fuera bilateral rechazaramos H0 para valores muy grandes y muy pequeos del estadgrafo de contraste, pero valores pequeos, se interpretan como gran parecido entre ambos tipos de frecuencias. Por tanto no nos interesa rechazar en los dos sentidos, sino slo en el caso de valores anormalmente grandes.

5.2.1.2 Tablas poco ocupadas


- Una problemtica ampliamente tratada en los libros de texto es el de las tablas poco ocupadas o tablas con valores de frecuencias prximos a cero. Cuando nos encontremos en esta situacin hay que estar prevenidos porque representan un problema de posible incremento en el riesgo tipo I. Se recomienda tenerlo en cuenta para frecuencias menores o iguales a 5. Si observamos la frmula del estadgrafo de contraste
podemos ver cmo las frecuencias esperadas van en el denominador. Frecuencias pequeas nos darn, al ir el en denominador, valores altos en el estadgrafo de contraste, lo que nos llevar, con mayor probabilidad, a rechazar la Ho, aunque sea cierta. Es decir, a un serio incremento en el riesgo tipo I probabilidad de rechazar indebidamente la Ho.

5.2.1.3 Causas de la significacin


- El test empleado nos mide discrepancias a nivel global, pero no nos informa acerca de dnde estn las discrepancias. Basta que en una sola casilla de la tabla se den
grandes discrepancias para obtener valores experimentales grandes que nos llevarn a rechazar la hiptesis, por tanto ante una magnitud grande no podremos saber si slo una, dos o todas las casillas discrepan.

Necesitamos un procedimiento posterior que nos ponga de manifiesto dnde

estn realmente las discrepancias: Bsqueda de las causas de la significacin.

344

5.2.2 Bsqueda de las causas de la significacin


Cuando un test

! 2 da no significativo, es decir aceptamos la H0 de

independencia entre las variables, el problema acaba ah, pero, si la significacin se produce, lo inmediato es intentar localizar la causa de la misma. La idea ahora es la descomponer la tabla original en subtablas que nos expliquen 2 las causas de la significacin. Para ello nos basamos en la propiedad aditiva de la ! .

5.2.2.1 Propiedad aditiva de la Ji-cuadrado


La propiedad aditiva de la ! dice:
2 2 !" + !2 " 2 = ! "1 + " 2 1
2

Es decir: si tenemos dos variables aleatorias que siguen respectivamente un modelo terico Ji-cuadrado con !1 y !2 grados de libertad, la suma de las dos nos da otra variable aleatoria que sigue un modelo Ji-cuadrado con la suma de los grados de libertad de las de partida.

5.2.2.2 Bsqueda de las causas de la significacin


El modo de partir la tabla original no es nico y slo el anlisis detallado de los datos nos dar las pautas a seguir. Para el desarrollo de este apartado utilizaremos el ejemplo visto con los alumnos, dado que all la conclusin a la que se llegaba era la de relacin entre ambas variables. La primera idea que se nos ocurre para analizar la situacin es saber lo que contribuye cada casilla al valor experimental (recordar que el rechazo se obtena para valores grandes de ste y, que bastaba que una casilla tuviera grandes discrepancias para producirse este hecho). De esta manera calcularemos la tabla de contribuciones, donde los valores de cada casilla se obtienen como:

345

(fo i ! fe i )2
fe i

En nuestro caso concreto:

Tabla de contribuciones
Trat 1 Trat 2 Trat 3 Trat 4 Peor 0.85 6.31 0.23 2.94 Igual 0.41 1.11 0.25 1.17 mejor 0.39 0.04 0.17 0.00 TOTAL 1.65 7.46 0.65 4.11 13.87

Donde el primer elemento de la primera columna se ha obtenido como:

(7 ! 9.91) 2
9.91

= 0.85

El primer elemento de la segunda columna como:

(28 ! 31.61)2
31.61

= 0.41 etc.

El anlisis de la tabla nos sugiere que el principal responsable de la significacin es el tratamiento 2 con una contribucin total de 7.46, superior a la de los otros 3 conjuntamente. Esto parece sugerir que los tratamientos 1,3,4 son homogneos entre si (la respuesta es independiente de estos tratamientos) y difieren del 2. De ah que intentemos realizar estos dos contrastes: Primero: Los tratamientos 1,3,4 son homogneos Segundo: Los tratamientos anteriores difieren del 2 Para llevar a cabo el primero de ellos construimos una subtabla en la que hemos de eliminar el tratamiento 2 (el aparentemente responsable de la significacin):
PEOR 7 IGUAL 28 MEJOR 115 TOTAL 150

T1

346

T3 T4 TOTAL

10 5 22

30 40 98

90 115 320

130 160 440

En dicha tabla realizaremos el contraste de independencia del mismo modo a como lo hicimos en la tabla original, con la esperanza de que en este caso la conclusin sea la de aceptar la Ho (lo que sugiere la observacin de los datos). Ahora las frecuencias esperadas no van a coincidir con el primer supuesto ya que los marginales de columnas son distintos (hemos eliminado a los enfermos tratados con el segundo de los tratamientos), tampoco coincidir el valor experimental ni los grados de libertad de la tabla. Siguiendo los pasos enunciados en el ejercicio de los alumnos obtenemos para este caso:

2 ! exp = 5. 04 que hemos de comparar con el correspondiente valor crtico de la


tabla en este caso con 4 grados de libertad, que result ser en este caso 2 ! 4;0.05 = 9.488

Concusin: ACEPTO Ho : HOMOGENEIDAD Como era de esperar hemos llegado a la conclusin de que estos tres tratamientos eran igualmente efectivos. Por tanto no se trata de tres tratamientos distintos sino de uno slo que llamaremos a partir de ahora tratamiento (1+3+4).

Para llevar a cabo el segundo de los contrastes, que nos ponga de manifiesto que es el tratamiento 2 el que difiere del resto necesitamos construir otra subtabla en la que se disponga de la informacin que nos interesa, es decir el tratamiento 2 y el tratamiento (1+3+4).

347

T2 T(1+3+4) Total

PEOR 15 22 37

IGUAL 20 98 118

MEJOR 85 320 405

Total 120 440 560

Realizado el contraste de independencia en esta subtabla obtenemos: 2 ! exp = 9.488 que hemos de comparar con un valor crtico, correspondiente a esta 2 situacin, con 2 grados de libertad. Dicho valor es: ! 2;0.05 = 9.21

La conclusin a la que llegamos es pues: Rechazo la H0 de independencia entre la respuesta y los dos tratamientos el 2 cualquiera de los otros.

Obsrvese que la descomposicin realizada de la tabla original es lcita puesto que se verifica la propiedad aditiva de la Ji-cuadrado. Hemos obtenido dos subtablas en la que las sumas de sus grados de libertad (4 y 2 respectivamente) coinciden con los grados de libertad de la tabla de partida (6). En resumen lo que hemos hecho es:

Variacin tratamientos 1,3,4 tratamientos 2 y (1+3+4) Sumas

g.l. 4 2 6

!2 exp.
5.04 9.48 14.52 13.87

significacin No ** **

tratamientos 1,2,3,4

Con esta descomposicin hemos probado que el tratamiento 2 difiere del resto como pareca intuirse de la tabla de contribuciones, pero esta afirmacin, aunque vlida no deja de ser incompleta ya que nada nos dice de en qu sentido es diferente, dicho de otra forma, difiere el tratamiento 2 del resto porque es peor o porque es mejor. Faltara,

348

pues, descomponer la ltima tabla que nos dio significativa, y que tena dos grados de libertad, en otras dos subtablas de 1 grado de libertad cada una para saber el sentido de las diferencias. Un esquema global de los pasos pueden verse en la figura 5.1.
P T1 P T1 T2 T3 T4 T2 I M T3 T4 P I M T1+T2+T3 T2 NS NS I M I M

*
T1+T2+T3 T2

(I+M)

*
T1+T2+T3

Figura 5.1: Esquema de descomposicin de la tabla de contingencia de partida para la bsqueda de la significacin

349

5.2.3 Paradoja de Simpson


Supongamos que se realiza un experimento para comparar un nuevo tratamiento para cierta enfermedad con el tratamiento estndar para esa enfermedad. En el experimento se tratan 80 individuos que padecen la enfermedad, 40 recibieron el nuevo tratamiento y 40 recibieron el estndar. Despus de un tiempo se observa cuantos de los individuos de cada grupo han mejorado y cuantos no. Supongamos que los resultados fueron:
TODOS LOS PACIENTES

MEJORAN

NO MEJORAN 20 24 20 16

NUEVO TRATAMIENTO TRAT. ESTNDAR

De acuerdo con la tabla, 20 de los 40 individuos que reciben el nuevo tratamiento mejoraron y 24 de los 40 individuos que recibieron el estndar mejoraron. Por tanto el 50% de los individuos mejoraron con el nuevo tratamiento, mientras que el 60% de los individuos mejoraron con el tratamiento estndar. El nuevo tratamiento parece inferior al tratamiento estndar. Para investigar la eficacia del nuevo tratamiento ms a fondo, se podra comparar con el tratamiento estndar slo para los hombres de la muestra y separadamente slo para las mujeres. Podramos pues desagregar esta tabla en otras dos subtablas: la de hombres y la de mujeres. Supngase que tenemos informacin suficiente para construir estas subtablas y que el resultado es el siguiente:
SOLO HOMBRES MEJORAN NO MEJORAN

NUEVO TRATAM TRAT. ESTNDAR

12 3

18 7

SOLO MUJERES NUEVO TRATAM TRAT. ESTNDAR

MEJORAN

NO MEJORAN

8 21

2 9

350

Obsrvese que si agregamos de nuevo las dos subtablas obtendramos de nuevo la tabla de partida. Sin embargo, el anlisis de las subtablas nos pone de manifiesto algo sorprendente, ya que el nuevo tratamiento parece ser ms efectivo que el estndar tanto en hombres como en mujeres. Especficamente, el 40% de los hombres (12 de cada 30) que reciben el nuevo tratamiento mejoraron, pero slo el 30% de los hombres (3 de cada 10) que recibieron el estndar mejoraron. Adems el 80% de las mujeres (8 de cada 10) que recibieron el nuevo tratamiento mejoraron pero slo el 70% de ellas (21 de cada 30) que recibieron el tratamiento estndar mejoraron. Est claro que la tabla inicial y las subtablas proporcionan resultados contradictorios. De acuerdo con la primera el tratamiento estndar es mejor para todos pero con las subtablas, el nuevo es superior, para hombres y para mujeres. A este tipo de resultados se le conoce como paradoja de Simpson. La paradoja de Simpson no es realmente una paradoja, slo es un resultado que sorprende y confunde cuando no se ha observado antes. Se puede ver en la subtabla correspondiente a mujeres que stas tienen una tasa de recuperacin de la enfermedad mayor que la de los hombres, independientemente del tratamiento que reciban. Adems, entre los 40 hombres de la muestra, 30 recibieron el nuevo tratamiento y slo 10 el estndar, mientras que para las mujeres estos nmeros son justamente al revs. Por tanto aunque los nmeros de hombres y de mujeres en el experimento fueron iguales, una alta proporcin de mujeres y una baja proporcin de hombres recibieron el tratamiento estndar. Puesto que las mujeres tienen una tasa de recuperacin mayor, se encuentra en la tabla agregada que el tratamiento estndar manifiesta una mayor tasa global de recuperacin que el nuevo tratamiento. La paradoja de Simpson demuestra de una forma drstica los peligros de realizar inferencias a partir de tablas agregadas. Para estar seguros de que la paradoja no est presente en un experimento las proporciones de relativas de hombres y de mujeres entre los individuos que reciben el nuevo tratamiento debe ser aproximadamente la misma, as como las proporciones relativas de hombres y de mujeres entre los individuos que reciben el tratamiento estndar. La posibilidad de la paradoja subyace en cualquier tabla de contingencia. An cuando se tuviera cuidado al disear un experimento particular de forma que no pudiera

351

ocurrir la paradoja cuando se desagrega para hombres y mujeres, siempre es posible que exista alguna otra variable, como la edad de los individuos o la intensidad y grado de avance de la enfermedad, con respecto a la cual la desagregacin podra conducir a una conclusin directamente opuesta a la indicada por la tabla agregada.