Está en la página 1de 76

276

"CONTRASTES DE HIPTESIS"

4.4 Parte bsica

277

4.4.1 Introduccin a los contrastes de


hiptesis
La Inferencia Estadstica consta de dos partes: Estimacin y Contrastes de
Hiptesis. La primera se ha estudiado en la unidad anterior y estaba destinada a tratar de
determinar el valor de un parmetro poblacional, a partir de lo observado en la muestra.
La tcnica de Contraste de Hiptesis es preciso para establecer procedimientos para
aceptar o rechazar hiptesis estadsticas emitidas acerca de un parmetro, u otra
caracterstica de la poblacin.
La nica forma de saber con certeza absoluta que una hiptesis estadstica es
verdadera, es examinar toda la poblacin. Pero esto, en la mayora de los casos resulta,
imposible (por falta de medios econmicos, imposibilidades tcnicas, etc.). Por lo tanto,
la decisin debe adoptarse a partir de los resultados de una muestra de la poblacin
(supuesta representativa), que nos inducir a tomar la decisin sobre la verdad o
falsedad de la hiptesis. Pero es difcil sta decisin, porque aunque sepamos
exactamente el valor del parmetro de la poblacin, en las muestras es muy difcil que
se verifique ese valor exacto, por lo que debemos decidir unos lmites de valores del
parmetro en la muestra, que nos puedan llevar a la decisin de aceptar el valor del
parmetro poblacional.
Por ejemplo, si una poblacin es normal N(150, 30), en todas las muestras de
tamao 36, aproximadamente en un 2% de ellas, la media muestral superar las 160
unidades, y en otro 2% aproximadamente ser inferior a las 140 unidades.
El problema, es pues, decidir a partir de qu valores de la media muestral
podemos aceptar que la media poblacional es de 150 unidades, y todo ello siempre con
un margen de error.

278

4.4.2 Conceptos bsicos


4.4.2.1 Hiptesis nula e Hiptesis alternativa
A la hiptesis que se desea contrastar la denominaremos Hiptesis nula, y la
denotaremos por Ho.
Esta hiptesis nula es la que se somete a comprobacin, y es la que se
acepta o rechaza, como la conclusin final de un contraste.
Puede surgir de diversos modos (Por discusiones tericas, como modelo terico,
por la experiencia, por intuicin, etc.).
Esta hiptesis nula lleva consigo una hiptesis alternativa, denotada por Ha o
H 1.
La hiptesis alternativa ser la que se acepta si se rechaza Ho y viceversa
En el ejemplo del prrafo anterior, si tratamos de determinar la media poblacional
(supuesta desconocida), la hiptesis nula podra ser:
Ho: Media poblacional = 150.
En ste caso, la hiptesis alternativa tendra la siguiente expresin:
Ha: Media poblacional 150.

4.4.2.2 Estadgrafo de contraste


El contraste de hiptesis, es pues, un mecanismo mediante el cual se rechaza la
hiptesis nula cuando existan diferencias significativas entre los valores muestrales y
los valores tericos, y se acepte en caso contrario. Estas variables se medirn mediante
una variable denominada estadgrafo de contraste, o estadstico de contraste, que
sigue una distribucin determinada conocida, y que para cada muestra tomar un valor
particular.

279

En el ejemplo anterior, el estadstico de contraste puede ser la media muestral,


pero segn hemos visto en unidades anteriores, conocemos que la variable

x!
Z= "

con n > 30

sigue una distribucin normal N(0,1), por lo que puede utilizarse sta variable como un
estadstico de contraste, ya que se conoce su distribucin.

4.4.2.3 Regin crtica y regin de aceptacin


Denominaremos regin crtica, al conjunto de valores del estadstico de contraste
que nos lleva a rechazar la hiptesis nula.
La regin crtica es el conjunto de valores del estadstico de contraste que
nos induce a rechazar la hiptesis nula
En el ejemplo anterior, si tomamos la media muestral como estadstico de
contraste, la regin crtica seran los valores de la media muestral superiores a 159.8, o
inferiores a 140.2. Pero si tomamos el estadstico Z, la regin crtica seran los valores
de Z cuyo valor absoluto sea mayor que 1.96.
Llamaremos regin de aceptacin, al conjunto de los valores del estadstico que
nos llevan a aceptar la hiptesis nula.
La regin de aceptacin es el conjunto de los valores del estadstico que nos
induce a aceptar la hiptesis nula.

4.4.2.4 Error tipo I y Error tipo II


Obviamente la conclusin tras un contraste de hiptesis puede ser cierta o no, ya
que no sabemos con certeza cul es la situacin verdadera. Esto nos puede llevar a las
situaciones reflejadas en el siguiente cuadro:

280

Decisin

Hiptesis
cierta

Ho
H1

Aceptar Ho

Rechazar Ho

Correcta

Error tipo I

Error tipo II

Correcta

O bien reflejadas en la siguiente forma:


. Si la hiptesis nula es cierta y se acepta, la decisin es correcta.
. Si la hiptesis nula es cierta y se rechaza sta, se comete un error; a este error
le

denominaremos error de tipo I.


. Si la hiptesis alternativa es cierta y se acepta la hiptesis nula, se comete un
error; a ste error le denominaremos error de tipo II.
. Si la hiptesis alternativa es falsa y se rechaza la hiptesis nula, la decisin es
correcta.

4.4.2.5 Nivel
contraste

de

significacin

potencia

del

Nivel de significacin del contraste es la probabilidad de cometer un error


del tipo I, es decir, de rechazar la hiptesis nula siendo cierta,
acostumbra a denotar por

y se

= P(cometer error tipo I) = P(rechazar Ho siendo cierta)

La interpretacin estadstica del error tipo I es la siguiente:


Si el experimento se repitiera un gran nmero de veces, sobre una poblacin con
media de 150 unidades, en el 100(1 - a)% de los casos, ese experimento llevara a la
conclusin verdadera de que = 150, y en el 100 a% de las veces conducira a la
decisin falsa de que 150.

281

La probabilidad de cometer error del tipo II se denota por


= P(cometer error tipo II) = P(aceptar Ho siendo falsa)
Su complementario hasta uno es lo que se llama potencia del contraste
La potencia del contraste, es la probabilidad de rechazar la hiptesis nula
siendo sta falsa., es decir, aceptar la hiptesis alternativa siendo cierta.
La interpretacin estadstica del error tipo II es la siguiente:
Si el experimento se repitiera un gran nmero de veces, sobre una poblacin con
media de 150 unidades, en el 100% de los casos, ese experimento llevara a la
conclusin falsa de que = 150, y en el 100 (1 - )% de las veces conducira a la
decisin verdadera de que 150.
Estas probabilidades se pueden conocer:
Si en el ejemplo de una poblacin normal N(, 30) tomamos una muestra de 36
elementos, y contrastamos Ho (=150) contra la hiptesis alternativa Ha (=165), y
consideramos como regin de aceptacin el intervalo (140, 160), entonces la
probabilidad de cometer error tipo I, es la probabilidad de que la media muestral
pertenezca a la regin crtica; es decir, sea mayor que 160, o menor que 140 unidades, y
la hiptesis nula sea cierta. As
= P(cometer error tipo I) = P( x 160/N(150,30))+P( x 140/N(150,30))=
=P(Z 2) + P(Z -2) = 0.0228 + 0.0228 = 0.0456
lo que nos da cierta informacin sobre la posibilidad de acertar en nuestra decisin,
aunque no sepamos el verdadero valor del parmetro poblacional.
Anlogamente se puede calcular la probabilidad de cometer error tipo II, es decir,
de que la media muestral pertenezca al intervalo (140, 160) y sea cierta la hiptesis
alternativa:
= P(cometer error tipo II) = P(140 x 160/N(165,30))=
P(-5 Z -1) = P(Z -1) - P(Z -5) = 0.1687 - 0.00001 = 0.168699.

282

4.4.2.6 Tipo de contraste


Segn que la regin crtica contenga una o dos regiones, diremos que el contraste
es unilateral, o bilateral.

Estos son los conceptos iniciales que deben tenerse en cuenta en un contraste de
hiptesis.

4.4.2.7 Pasos en un contraste de hiptesis


Veamos ahora los pasos que son convenientes seguir para realizar el contraste de
hiptesis:
1 Determinar, claramente, la hiptesis nula Ho y la hiptesis alternativa
Ha.
2 Elegir el nivel de significacin.
3 Seleccionar un estadstico cuya distribucin muestral sea conocida en el
caso de que la hiptesis nula sea cierta.
4 Determinar la regin crtica.
5 Calcular el valor del estadstico de contraste para la muestra elegida.
6 Sacar las conclusiones estadsticas del contraste (aceptar o rechazar Ho).
7 Sacar las conclusiones no estadsticas (biolgicas, mdicas, econmicas,
etc.) a que nos llevan los resultados estadsticos.

283

4.4.3 Contraste para la media de una


poblacin normal
4.4.3.1 Contraste para la media de una poblacin
normal, con varianza poblacional conocida
Supongamos que queremos contrastar la hiptesis de que la media de una
poblacin normal, toma un valor especfico o , cuando la varianza 2 de la poblacin
es conocida.

En ste caso, la hiptesis nula ser, en general: Ho ( = o )

Mientras que la hiptesis alternativa puede tener diversas expresiones:

Ha ( = 1 ) , o bien, Ha ( < o ), Ha ( > o ), o bien Ha ( o ).


Estadgrafo de contraste: El contraste se efectuar tomando muestras
aleatorias de tamao n. Conocemos que la distribucin de la media muestral sigue una
distribucin normal N(, /n). Entonces, si x es la media de una muestra de tamao n,
entonces la variable

x!
Z= " o
n

seguir, cuando la hiptesis nula sea cierta una distribucin normal estndar N(0,1). Se
puede utilizar as pues sta variable como estadstico de contraste en ste caso.

Nivel de significacin: El nivel de significacin ser , que, generalmente

tomar los valores 0.1, 0.05 0.01.


Regin crtica:
Si la hiptesis nula fuese cierta y = o , cabe esperar que la media muestral x
se distribuya en torno al valor o, es decir, x - o tendr un valor elevado para que
existan evidencias de que la hiptesis nula sea falsa, es decir, la variable Z tomar un
valor absoluto grande; as pues, la regin crtica estar formada por los valores de Z
elevados, tanto positivos como negativos. Para especificar cuando se consideran

284

elevados, teniendo en cuenta la distribucin de Z, sern aquellos que sean mayores, en


valor absoluto, que z/2, en el contraste bilateral, o que z en el contraste unilateral.
Si la hiptesis nula fuese Ho ( o ), entonces dejaran de pertenecer a la regin
crtica los valores positivos grandes, y el contraste es, en ste caso, unilateral. (Ver
figuras 4.2 y 4.3).

1-!

nivel de significacin

!/2

!/2
-z!/2

Regin crtica

z!/2

Regin de
Aceptacin

Regin crtica

Figura 4.10: Regiones crtica y de aceptacin en un contraste bilateral cuando la


distribucin es normal estndar.

1- !

0
Regin de
Aceptacin

nivel de significacin

z!
Regin crtica

Figura 4.11: Regiones crtica y de aceptacin en un contraste unilateral cuando la


distribucin es normal estndar.

285

4.4.3.2 Contraste para la media de una poblacin


normal, con varianza poblacional desconocida
MUESTRAS GRANDES
Estadgrafo de contraste:
En el mismo caso que en el prrafo anterior, y con las mismas hiptesis, si el
tamao de la muestra es suficientemente grande (n > 30), aunque sea desconocida la
varianza poblacional, se consiguen buenos resultados utilizando como estimador de la
varianza poblacional la cuasi-varianza muestral y, por lo tanto, se puede tomar como
estadstico de contraste el mismo que se tom cuando la varianza poblacional era
conocida; es decir

Z=

x ! o
s

es una variable que sigue una distribucin normal estndar N(0,1), por lo que el
razonamiento es idntico al caso anterior.

MUESTRAS PEQUEAS
Estadgrafo de contraste:
Si el tamao de la muestra es pequeo (n < 30), sabemos de unidades anteriores
que la variable

t=

x ! o
s

n !1

difiere sensiblemente de una distribucin normal, aproximndose bastante mejor por


una distribucin t de Student, con n-1 grados de libertad, por lo que sta variable t
puede utilizarse con un estadstico de contraste.
Regin crtica:
La regin crtica, en ste caso, estar determinada por los valores de la variable t
que sean excesivamente grandes en valor absoluto, si el contraste es bilateral, y para
especificar el nivel de cuando pueden considerarse grandes, teniendo en cuenta la

286

distribucin de la variable t, que sigue una distribucin t con n-1 grados de libertad,
sern aquellos valores mayores que t/2,n-1 en el contraste bilateral, o que t,n-1 en el
contraste unilateral.
Las regiones crticas sern pues, anlogamente al caso de la varianza poblacional
conocida, los siguientes (ver figuras 4.4 y 4.5):

nivel de confianza

!/2

-t !/2
Regin crtica

!/2

1"!

0
Regin de
Aceptacin

nivel de significacin

t !/2
Regin crtica

Figura 4.12: Regiones crtica y de aceptacin en el contraste bilateral cuando


la variable se distribuye segn una t de Student.

Figura 4.13: Regiones crtica y de aceptacin en el contraste unilateral cuando


la variable se distribuye segn una t de Student.

287

4.4.4 Contraste de hiptesis para la


igualdad
de
medias
de
dos
poblaciones normales
En este apartado consideraremos dos poblaciones con distribuciones normales con
medias 1 y 2 y varianzas !12 y ! 22 respectivamente, de las cuales extraemos
muestras aleatorias independientes de tamaos n1 y n2 respectivamente. El objetivo de
ste apartado ser determinar si las dos poblaciones pueden considerarse con la misma
media poblacional, es decir, la hiptesis nula ser Ho (1 = 2 ), mientras que la
hiptesis alternativa puede tener diversas expresiones: Ha (1 < 2 ), o bien, Ha (1 >
2 ), o bien Ha (1 2 ).
Estas hiptesis son equivalentes a las siguientes: la hiptesis nula ser
Ho (1 - 2 = 0), mientras que la hiptesis alternativa tendr stas expresiones: Ha (1
- 2 < 0), o bien, Ha (1 - 2 > 0), o bien Ha (1 - 2 0).

4.4.4.1 Contraste de hiptesis para la igualdad de


medias de dos poblaciones normales con varianzas
poblacionales conocidas.
Estadgrafo de contraste:
Conocemos del tema relacionado con las distribuciones normales, que la
diferencia de dos distribuciones normales se distribuye tambin normalmente con media
la diferencia de las medias, y varianza la suma de las varianzas, por lo que la variable
#
"12 " 22 &
+
x1 ! x2 ser una variable que se distribuye normalmente N% 1 ! 2 ,
( , por
n1 n2 '
$
lo que en el caso particular de conocer las varianzas poblacionales, podemos utilizar
como estadstico de contraste la variable

Z=

x1 ! x2
"12 " 22
+
n1 n 2

288

que, en el caso de que la hiptesis nula sea cierta (1 = 2 ), se distribuye como una
distribucin normal estndar N(0,1), y, por lo tanto, puede utilizarse como estadstico de
contraste, dado que conocemos su distribucin.

Regin crtica:
La regin crtica estar formada por los valores de Z elevados, tanto positivos
como negativos. Para especificar cuando se consideran elevados, teniendo en cuenta la
distribucin de Z, sern aquellos que sean mayores, en valor absoluto, que Z/2, en el
contraste bilateral, o que z en el contraste unilateral.

4.4.4.2 Contraste de hiptesis para la igualdad de


medias de dos poblaciones normales con varianzas
poblacionales desconocidas pero iguales
MUESTRAS GRANDES
Estadgrafo de contraste:
Supongamos ahora que las varianzas son desconocidas pero iguales (1 = 2 = ).
Si las muestras tienen tamao grande, aunque no se conozca la varianza poblacional, se
trabaja como si se conociese utilizando en lugar de la varianza poblacional, su
estimador la cuasivarianza muestral, por lo que la distribucin de la diferencia de
"
1
1 %'
medias
muestrales
es
ahora
,
N$ 1 ! 2 , s
+
n1 n2 &
#
siendo s =

(n1 ! 1)s12 + (n2 ! 1)s22


, por lo que la variable tipificada es una normal
n1 + n2 ! 2

estndar

Z=

( x1 ! x2 ) ! (1 ! 2 )
1
1
S
+
n1 n2

Entonces, si ha hiptesis nula es cierta, (1 =2 ), la variable

Z=

( x1 ! x2 )
S

1
1
+
n1 n 2

289

se distribuye como una distribucin normal estndar, por lo que se puede utilizar como
un estadstico de contraste.

Regin crtica:
La regin crtica se determina igual que en el prrafo anterior, es decir, para los
valores de Z mayores, en valor absoluto, que z/2 (contraste bilateral), o que z
(contraste unilateral).

MUESTRAS PEQUEAS
Estadgrafo de contraste
Pero, si las muestras son pequeas (n1 + n2 < 30), entonces la variable siguiente

t=

con S =

(x1 ! x2 ) ! (1 ! 2 )
1
1
S
+
n1 n2

(n1 ! 1)S 12 + (n2 ! 1)S 22


, sigue una distribucin t de Student con n1+n2-2
n1 + n2 ! 2

grados de libertad.
Si la hiptesis nula es cierta, el estadgrafo de contraste que utilizaremos es

t=

(x1 ! x2 )
1
1
S
+
n1 n 2

porque se distribuye como una t de Student con n1+n2-2.


Regin crtica:
La regin crtica viene determinada por los valores de esta variable t, que son
mayores en valor absoluto que t/2 en el contraste bilateral, o bien los valores de t, que
son mayores en valor absoluto que t en el contraste unilateral.

290

4.4.5 Contraste
binomiales

para

distribuciones

Estudiaremos slo contrastes en los que sea posible aproximaciones de la


binomial mediante la normal, por lo que estudiaremos slo los casos de muestras
grandes, de tamao > 30.

4.4.5.1 Contraste para el parmetro p de una


distribucin Binomial
Partimos de una poblacin que se ajuste al modelo binomial B(n, p), siendo p la
!
probabilidad de "xito"; denotaremos por p a la proporcin muestral de casos
favorables y por po el valor hipottico con el que queremos contrastar el valor del
parmetro p.

Hiptesis de partida
En ste caso, la hiptesis nula ser:
Ho : p = p o
y la hiptesis alternativa puede ser:
Ha : p po en el contraste bilateral,
o bien Ha : p > po , en el contraste unilateral (tambin Ha : p < po).

Estadgrafo de contraste:
Como conocemos que la distribucin binomial B(n, p) se aproxima mediante una
variable normal N(np, npq ), entonces, se verifica que la variable
p ! p o
Z=
p (1 ! p )
n
se distribuye como una distribucin normal estndar N(0,1).

291

Regin crtica:
La regin crtica, ahora, ser la determinada por los valores de la variable Z que
son mayores en valor absoluto que z/2 , en el contraste bilateral, o bien, mayores que
z , en el contraste unilateral.

4.4.5.2 Contraste para la igualdad de los parmetros


de dos distribuciones binomiales
Partimos, en ste caso, de dos distribuciones binomiales B(n1, p1) y B(n2, p2)
respectivamente. En las muestras los parmetros muestrales sern p 1 y p2
respectivamente.

Hiptesis de partida:
La hiptesis nula ser:
Ho : p 1 = p 2
mientras que la hiptesis alternativa puede ser :
Ha : p 1 p 2

Estadgrafo de contraste:
Ahora, teniendo en cuenta las propiedades de las distribuciones normales, por las
que se aproximan las binomiales, se verifica que la variable

Z=

! !
p1 ! p2
!
!
!
!
p1(1 ! p1) p2 (1 ! p 2 )
+
n1
n2

se distribuye, cuando la hiptesis nula es cierta, como una distribucin normal estndar
N(0,1)

Regin crtica:

292

La regin crtica ser anloga a todas aqullas en el que el estadstico de contraste


sigue una distribucin normal.

293

"CONTRASTES DE HIPTESIS"

4.5 Ampliacin

294

4.5.1 Introduccin y motivacin


Antes de comenzar con el desarrollo del tema se supone que el lector conoce los
conceptos fundamentales de muestreo, los principales estimadores de los parmetros de
distribuciones normales y sus correspondientes distribuciones muestrales, y los
conceptos bsicos asociados a los contrastes de hiptesis como son el riesgo tipo I, tipo
II, potencia del contraste, etc....
Aunque muchos de los conceptos han sido ya explicados en la parte bsica, se
repiten aqu encuadrados en el problema general de la investigacin aplicada aadiendo
una posible gua para la explicacin de los mismos en contextos aplicados a las ciencias
experimentales.

Comenzaremos ilustrando las ideas generales sobre el contraste ms simple, el de


la media de una poblacin Normal, para ir extendiendo progresivamente las ideas a dos
poblaciones, a la comparacin de proporciones y a las poblaciones no normales.
Analizaremos la problemtica de realizar un nmero elevado de contrastes sobre el
mismo conjunto de datos, y extenderemos las ideas fundamentales al diseo de
experimentos con varios grupos experimentales.

4.5.2 Contraste para la media de una


poblacin Normal
4.5.2.1 Planteamiento general
Consideremos un caso muy simple mediante un ejemplo concreto.
Supongamos que pertenecemos al consejo regulador de la denominacin de
origen de los vinos de Ribera de Duero. Sabemos que los vinos jvenes de
aos anteriores tienen un grado alcohlico medio de 12.5 grados, tal y
como aparece en la etiqueta. Para el ao actual, el consejo regulador, de
acuerdo con todos sus miembros, ha decidido cambiar algunos de los pasos
del proceso de fabricacin. El primer problema que se plantea es: Se ha
modificado el grado alcohlico al modificar el proceso de fabricacin?.

295

La definicin del problema a estudiar nos permite determinar la poblacin que


queremos estudiar, los vinos jvenes de ribera de Duero en el ao actual; la variable que
queremos medir, el grado alcohlico de los mismos, y la hiptesis de trabajo inicial Se
ha modificado el grado alcohlico?.
El paso siguiente consiste en suponer un modelo de comportamiento terico para
la poblacin (a priori). Suponemos que la variable que estamos midiendo en la
poblacin a estudiar sigue una distribucin Normal. La suposicin de normalidad la
haremos de acuerdo con el conocimiento previo que tengamos sobre la poblacin objeto
de estudio tratando de que las caractersticas de la distribucin reflejen en la mayor
medida posible las de la poblacin, se trata simplemente de buscar un modelo
probabilstico que aproxime la variable a estudiar. En el caso que nos ocupa, parece
razonable suponer, a priori, que el grado alcohlico se concentra de forma simtrica
alrededor de un valor medio. Si considerramos, por ejemplo, los salarios de una
empresa la hiptesis de normalidad no es plausible puesto que cabe esperar que la
distribucin de los mismos sea marcadamente asimtrica debido a los altos salarios de
un grupo reducido de ejecutivos.
Formularemos ahora la hiptesis de trabajo en trminos de los parmetros del
modelo (media y/o desviacin tpica en el caso de la Normal). La hiptesis principal la
denominamos hiptesis nula (H0).

H0 = = 0 = 12.5
La hiptesis nula suele ser la de igualdad del parmetro a un nico valor concreto
o procedente de la hiptesis de trabajo.
Junto con la hiptesis nula planteamos la que denominamos hiptesis alternativa
(Ha o H1) que ser aceptada cuando se rechace la nula y viceversa. Por el momento
tomaremos la ms sencilla, la hiptesis e que la media es diferente de 12 que resultar
en un contraste bilateral.

Ha = ! 0 = 12.5
Trataremos de disear un procedimiento para decidir entre ambas hiptesis a
partir de la informacin contenida en una muestra de tamao n, por ejemplo 14
observaciones.

296

Supongamos que la muestra ha sido seleccionada al azar de la poblacin y que se


han obtenido los resultados siguientes.

RIBERA DE DUERO
12,8 12,8 12,5 11,9 12,5 12,1 12,2 12,6 13,0 12,4 12,6 12,2 12,8 13,0
Tabla 4.1: Grado alcohlico de 14 vinos de la denominacin de Ribera de Duero.

La primera cuestin que hemos de tener en cuenta es que la decisin por una
hiptesis concreta ha de tomarse con un cierto riesgo de equivocarse al no disponer de
la informacin de todos los individuos de la poblacin. Trabajaremos con la media
muestral como estimador de la media poblacional desconocida. En el ejemplo la media
muestral es de 12,529, que como ya sabemos no coincide con la media poblacional.
Trataremos de decidir entre las dos hiptesis a partir del valor de la media
muestral pero, si la media muestral no coincide con la media poblacional, ser la
diferencia entre el valor observado y el terico lo suficientemente grande como para
rechazar la hiptesis nula? o la diferencia observada es lo suficientemente pequea
como para ser debida simplemente al azar o al desconocimiento de la poblacin?.
Daremos respuesta a ambas preguntas utilizando los conceptos sobre distribuciones
aprendidos en temas anteriores.

4.5.2.2 Varianza (desviacin tpica conocida)


2

Supondremos, por el momento, que la varianza de la poblacin es ! = 0.5

conocida. Sabemos que la media muestral para distintas muestras sigue una distribucin
!
) , luego, cuando la hiptesis nula es cierta
Normal N(,
n

x ! N(0 ,

"
)
n

En la prctica, este resultado tiene implicaciones importantes. Vemoslo con un


dibujo (figura 4.7).

297

x ! N( 0 , " )
n

Figura 4.14: Distribucin de la media muestral.

El dibujo muestra cmo, aunque los valores de la media muestral no coinciden


con la media poblacional, se concentran en torno a ella y por tanto es muy probable que
sean cercanos aunque, con el modelo supuesto puede tomar cualquier valor. Obsrvese
tambin que cuanto mayor es el tamao muestral ms se concentran los valores de la
media muestral en torno a la media poblacional.
Intuitivamente, aceptaremos la hiptesis nula cuando la media muestral sea
prxima a 0 y la rechazaremos (aceptando la alternativa) cuando la media muestral
sea muy diferente de 0 , es decir, utilizamos la media muestral como estadstico, o
estadgrafo, de contraste. Nos queda por determinar cual es el criterio para decidir si la
media muestral est prxima o no al valor terico propuesto utilizando el concepto de
riesgo tipo I definido previamente. Fijamos el riesgo tipo Y en (por ejemplo en 0.05 o
el 5%)
Nos plantearemos el contraste como un juicio en el que la media muestral es
inocente (procede de una poblacin con media 0 ) y no la declararemos culpable (no
procede de una poblacin con media 0 ) hasta que no se demuestre claramente lo
contrario.
Sobre la distribucin de la media seleccionamos dos puntos 0 ! a y 0 + a ,
simtricos alrededor de 0 de forma que si la hiptesis nula cierta en el (1-)100% (por
ejemplo el 95%) de las muestras la media muestral est entre esos dos valores (figura
4.8).

P(0 ! a " x " 0 + a) = 1 ! #

298

Figura 4.15: Procedimiento de contraste a partir de la media muestral

Aceptaremos la hiptesis nula si la media muestral est dentro del intervalo


seleccionado y la rechazaremos en caso contrario. Es claro que si la media est fuera del
intervalo seleccionado hay una clara evidencia de que la hiptesis no es cierta ya que
toma los valores correspondientes solo en el 5% de los casos en los que la hiptesis nula
es cierta. Por supuesto, estamos asumiendo un riesgo del 5% de equivocarnos y rechazar
indebidamente.
Como ya es conocido, al conjunto de valores que nos llevan a aceptar la hiptesis
nula lo denominamos Regin de Aceptacin, y al conjunto de valores que nos llevan a
rechazarla Regin Crtica. En este caso la regin crtica se ha dividido en las dos colas
de la distribucin por lo que se dice que el contraste es bilateral o de dos colas.
En la prctica no se trabaja directamente con la media muestral y su distribucin
asociada sino con la distribucin Normal estndar. Teniendo en cuenta las propiedades
de la Normal podemos escribir
x !
P(0 ! a " x " 0 + a) = P(!z# /2 " $ 0 " z #/ 2 ) = 1 ! #
n

de forma que el procedimiento descrito se convierte ahora en el que se muestra en la


x!
figura 4.9. El estadgrafo de contraste es ahora " 0 y mide la discrepancia entre el
n
valor observado de la media l valor terico de la misma, en la escala de la desviacin

299

tpica. No es lo mismo una diferencia de una unidad en una escala de centmetros que en
una escala de kilmetros.

Figura 4.16: Procedimiento de contraste a partir de la media muestral estandarizada.

La interpretacin intuitiva del nuevo procedimiento sigue siendo clara,


rechazaremos la hiptesis nula solamente cuando la discrepancia entre la media
observada y la terica ( x ! 0 ) sea grande, en relacin a la variabilidad intrnseca
!
medida por
. La magnitud de la diferencia necesaria para rechazar se determina a
n
travs del riesgo de tipo 1 mediante la distribucin Normal estndar.
A los valores de z/2 se les suele denominar valores crticos ya que determinan la
frontera entre la regin crtica y la regin de aceptacin.
El cuadro 4.2 muestra el procedimiento completo con los pasos que se siguen
habitualmente en la construccin de cualquier contraste.

300

Hiptesis
H0 : = 0

Ha : ! 0
Nivel de significacin:
x !
Estadgrafo de contraste: Z = " 0
n
Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1)
Regin de aceptacin: {Z / Z ! z "/ 2 }
Regin critica: {Z / Z > z !/ 2 }

Cuadro 4.2: Contraste para la media de una poblacin Normal con varianza conocida.

Una vez que hemos determinado la forma general del contraste pasamos a
aplicarlo a los datos del problema inicial que nos ocupa (ver cuadro 4.3).
Hiptesis:

H0 : = 12.5
Ha : ! 12.5
Nivel de significacin: 5% y 1%.
x !
12.529 ! 12.5
= 0.217
Estadgrafo de contraste: Z = " 0 = 0.5
n
14
Valores crticos : para el 5% z0.025= 1,96 para el 1% z0.005= 2,57
Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de
aceptacin, por tanto aceptamos la hiptesis nula.
Conclusin no estadstica: La modificacin en el proceso de fabricacin no ha
modificado significativamente el grado alcohlico.
Cuadro 4.3: Aplicacin del contraste para la media de una poblacin Normal con varianza conocida al
problema de la modificacin en el grado alcohlico del vino de Ribera de Duero

Una vez que hemos tomado la decisin final, no sabemos si es correcta o no,
simplemente esperamos que sea del 95% de las muestras en las que aceptamos la
hiptesis correctamente. Si aceptamos la hiptesis nula no quiere decir que sea cierta y
el grado medio sea exactamente de 12.5 grados (probablemente no lo es), sera ms
correcto interpretar que, con la informacin de la que disponemos no hemos encontrado
evidencia suficiente de que la media sea distinta de 12.5. Evidentemente, los valores
muestrales son compatibles con muchos otros posibles valores tericos.
Si aumentamos el tamao de muestra indefinidamente, la variabilidad de la media

301

sera cada vez menor y conseguiramos que la pequea diferencia observada sea lo
suficientemente grande como para considerarla significativa. Es por esto por lo que en
Estadstica decimos que es tan malo tener un tamao de muestra demasiado alto como
tenerlo demasiado bajo ya que en el primer caso cualquier pequea diferencia es
considerada como significativa mientras que en el segundo no se declara significacin
incluso en el caso en el que la diferencia sea elevada.

4.5.2.3 La potencia de un contraste


En todo el proceso descrito hasta el momento solamente se ha utilizado el riesgo
de tipo I en el desarrollo del contraste. Sabemos que esta asociado con el riesgo de tipo
II de forma que cuando uno aumenta, el otro disminuye. Tampoco hemos hecho
ninguna afirmacin acerca de un concepto importante como es el de potencia del
contraste (probabilidad de rechazar la hiptesis nula cuando es falsa).
No es posible calcular la potencia del contraste porque para ello necesitaramos un
nico valor en la hiptesis alternativa (revsese el ejemplo de los cirrticos utilizado
como aplicacin de la distribucin Normal), aunque si podemos realizar el clculo para
distintos valores en la alternativa (funcin de potencia) y analizar lo que ocurre.
Vemoslo con un ejemplo.
Cual sera la potencia del contraste obtenido para detectar que la media no es 12.5
si en realidad la media fuera 13 (y suponiendo un nivel de significacin del 5%).
En trminos de la media muestral el procedimiento de contraste consiste en
aceptar la hiptesis nula si la media muestral est entre 12.238

12.762. La

probabilidad de cometer un error de tipo 2 (aceptar indebidamente) si la media real


fuera de 13 se podra calcular como P(12.382 ! X ! 12.762) en una Normal de media
0.5
13 y desviacin tpica
. Esta probabilidad es 0.037 de forma que la potencia es 1 14
0.037 = 0.963. La situacin esquematizada aparece en la figura 4.10.

302

Figura 4.17: Clculo de la potencia del contraste para una alternativa predeterminada.

En la figura 4.11 se muestra la funcin de potencia para distintos valores posibles


de la hiptesis alternativa.

Figura 4.18: Funcin de potencia para distintos valores de la alternativa.

El grfico muestra como la potencia es mayor cuando los valores de la alternativa


se alejan del valor para la hiptesis nula. En la prctica este hecho tiene una implicacin
obvia: es ms fcil detectar diferencias o efectos experimentales de gran magnitud.
Aunque no es posible un control directo de la potencia, a la vista de la figura 4.10

303

es claro que la potencia puede modificarse modificando el nivel de significacin o el


tamao muestral ya que la forma de las curvas depende de ste. Cuanto mayor sea el
tamao muestral ms concentrada es la curva Normal y, por tanto, mayor es la potencia
para el mismo nivel de significacin.
En la prctica suele hacerse un estudio de potencia para los contrastes no
significativos, calculando cual sera el tamao muestral necesario para que la diferencia
observada en los datos sea significativa. Si este tamao es muy grande es difcil declarar
la significacin por lo que consideraremos que estamos haciendo lo correcto, si el
tamao muestral necesario es pequeo, sera conveniente revisar el experimento.
El clculo es muy simple cuando se trabaja con distribuciones normales. La
x ! 0
> z #/ 2 de forma que, para que la diferencia
hiptesis nula se rechaza cuando "
n
sea significativa el valor de n ser
z2 "2
n > !/ 2
x # 0

para el ejemplo del grado alcohlico, n> 1141,97, es decir, para que la diferencia
observada fuera significativa tendramos que haber recogido ms de 1142 observaciones
lo que da una idea de que la diferencia observada es muy pequea y, por tanto es muy
probable que la hiptesis nula sea cierta.

4.5.2.4 El p-valor del contraste


Una forma habitual de medir la significacin en los contrastes de hiptesis es el
denominado p-valor del contraste. Su utilizacin en la investigacin aplicada es debida
a que es la forma de presentacin de los resultados de un contraste usada por la mayor
parte de los programas de ordenador.
Se puede definir el p-valor de un contraste como la probabilidad de obtener un
valor muestral ms extremo que el obtenido en nuestro caso particular (cuando H0 es
cierta). Si el p-valor es muy pequeo rechazaremos la hiptesis nula ya que el valor
experimental es muy extremo, mientras que si el p-valor es grande aceptaremos la
hiptesis nula ya que el valor es compatible con la misma.

304

De forma general, el p-valor para el contraste actual se puede calcular como


#
x ! &
P% Z > " 0 ( en una distribucin Normal estndar.
$
n '
Para el ejemplo anterior el p-valor es 1-P(-0.217 < Z < 0.217) = 2 P(Z > 0.217) =
0.8285, es decir el p-valor puede considerarse grande. En la prctica se suele adoptar el
criterio de aceptar la hiptesis cuando el p-valor es mayor que el nivel de significacin
fijado en el procedimiento de contraste.

Figura 4.19: El p-valor de un contraste bilateral.

4.5.2.5 Los contrastes unilaterales


En algunas situaciones concretas no estamos interesados en todos los posibles
valores de la hiptesis alternativa propuesta en un contraste bilateral. Supongamos, por
ejemplo, que en el caso prctico anterior sospechamos a priori que la modificacin en el
procedimiento de fabricacin produce un incremento en el contenido alcohlico. En este
caso sera conveniente modificar la hiptesis alternativa para que sea de la forma
Ha : > 0 . El procedimiento de contraste es muy similar al anterior y se muestra en el
cuadro 4.4.

305

Hiptesis
H0 : = 0

Ha : > 0
Nivel de significacin:
x !
Estadgrafo de contraste: Z = " 0
n
Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1)
Regin de aceptacin: {Z / Z ! z "/ 2 }
Regin critica: {Z / Z > z !/ 2 }

Cuadro 4.4: Contraste unilateral superior para la media de una poblacin Normal con varianza conocida.

El contraste as obtenido se denomina contraste unilateral superior ya que solo


estamos interesados en las desviaciones positivas. La diferencia fundamental con el
contraste bilateral es que se produce un incremento en la potencia para detectar
diferencias positivas de la hiptesis nula y un decremento drstico para detectar las
negativas.
El p-valor sigue teniendo la misma interpretacin aunque ahora se calcula como
#
x ! &
P% Z > " 0 ( .
$
n '

Figura 4.20: El p-valor de un contraste unilateral superior.

De la misma manera que se ha construido el contraste unilateral superior es


posible construir el contraste unilateral inferior (ver cuadro 4.5) si estamos interesados

306

exclusivamente en detectar diferencias negativas con respecto a la hiptesis nula. La


construccin del contraste es completamente anloga con la correspondiente
modificacin de la hiptesis alternativa. El contraste unilateral inferior incrementa la
potencia para detectar diferencias negativas aunque no tiene potencia para detectar las
positivas.
Hiptesis
H0 : = 0

Ha : < 0
Nivel de significacin:
x !
Estadgrafo de contraste: Z = " 0
n
Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1)
Regin de aceptacin: {Z / Z ! z "/ 2 }
Regin critica: {Z / Z < z !/ 2 }
#
x ! 0 &
p-valor: P% Z >
(
"
$
n '

Cuadro 4.5: Contraste unilateral inferior para la media de una poblacin Normal con varianza conocida.

Figura 4.21: El p-valor de un contraste unilateral inferior.

La decisin por el tipo de contraste debe hacerse a priori, antes de tomar los datos.
Supongamos, por ejemplo, que sospechamos, antes de realizar el experimento, que la
modificacin en el proceso de fabricacin, aumenta el grado alcohlico. El
procedimiento de contraste para los datos de la tabla 1 se muestra en el cuadro 4.6.

307

Hiptesis:

H0 : = 12.5
Ha : > 0
Nivel de significacin: 5% y 1%.
x !
12.529 ! 12.5
= 0.217
Estadgrafo de contraste: Z = " 0 = 0.5
n
14
Valores crticos : para el 5% z0.025= 1,65 para el 1% z0.005= 2,33
p-valor: 0.4129
Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de
aceptacin, por tanto aceptamos la hiptesis nula.
Conclusin no estadstica: La modificacin en el proceso de fabricacin no ha
aumentado significativamente el grado alcohlico.
Cuadro 4.6: Aplicacin del contraste para la media de una poblacin Normal con varianza conocida al
problema de la modificacin en el grado alcohlico del vino de Ribera de Duero

La funcin de potencia para distintos valores de la alternativa aparece en la figura


4.15. Obsrvese como el contraste no tiene ninguna potencia para detectar valores a la
izquierda de la hiptesis nula.

Figura 4.22: Funcin de potencia para un contraste unilateral superior.

308

4.5.2.6 Varianza desconocida


En la mayor parte de las aplicaciones prcticas la varianza de la distribucin es
tambin desconocida y ha de ser estimada a partir de los datos. El problema es que ya
no es posible seguir utilizando la distribucin Normal para el procedimiento de
contraste ya que es necesario eliminar el parmetro del estadgrafo de contraste.
De acuerdo con la teora, adems de la distribucin muestral de la media sabemos
(n ! 1)S 2
que
sigue una distribucin ji-cuadrado con n-1 grados de libertad. Si
2
"
suponemos que media y varianza son independientes* , es posible combinar las
correspondientes distribuciones muestrales para obtener una distribucin t de Student y
eliminar el parmetro .
Utilizando la definicin de distribucin t de Student con n-1 grados de libertad
como el cociente entre una Normal estndar y la raz cuadrada de una ji-cuadrado con n1 grados de libertad dividida por sus grados de libertad, y ambas independientes,
obtenemos que la variable aleatoria

t=

x ! 0
"
x !
n
= 0
S
(n ! 1)S 2
n
"2
(n ! 1)

sigue una distribucin t de Student con n-1 grados de libertad.


El procedimiento de contraste en este caso es anlogo al anterior pero
sustituyendo la distribucin Normal por la distribucin t. El cuadro 4.7 muestra el
procedimiento de contraste completo.

La demostracin completa no se realiza aqu.

309

Hiptesis
H0 : = 0

Ha : ! 0
Nivel de significacin:
x ! 0
Estadgrafo de contraste: t =
S
n
Distribucin del estadgrafo cuando la hiptesis nula es cierta: tn-1
Regin de aceptacin: {t / t ! t n "1,# }
Regin critica: {t / t > t n !1," } *

Cuadro 4.7: Contraste para la media de una poblacin Normal con varianza desconocida.

En la prctica, la sustitucin de la distribucin Normal por la distribucin t de


Student implica un aumento de la dispersin por lo que es ms difcil detectar
diferencias. La situacin se muestra el la figura 4.16 en la que se comparan la
distribucin Normal estndar (en lnea discontinua) y la distribucin t (en lnea
continua).

x "
t = 0 # t n"1
s
n

1"!
!/2

!/2

-t !

t!

Figura 4.23: Diferencia entra la distribucin Normal y la distribucin t de Student.

Es posible construir contrastes unilaterales de la misma manera que en el caso de


varianza conocida. El cuadro 4.8 muestra el contraste unilateral superior, el contraste
unilateral inferior se deja como ejercicio al lector.

tn-1, es el valor crtico de la t de Student tal que P(-tn-1, tn-1 tn-1, ) = 1-. Se ha denotado con el

subndice porque es el que se utiliza para buscar el valor correspondiente en la tabla.

310

Hiptesis
H0 : = 0

Ha : > 0
Nivel de significacin:
x ! 0
Estadgrafo de contraste: t =
S
n
Distribucin del estadgrafo cuando la hiptesis nula es cierta: tn-1
Regin de aceptacin: {t / t ! t n "1,2# }*
Regin critica: {t / t > t n !1,2" }

Cuadro 4.8: Contraste para la media de una poblacin Normal con varianza desconocida.

Para el ejemplo del grado alcohlico de los vinos de la denominacin de origen de


Ribera de Duero los resultados del contraste bilateral se muestran en el cuadro 4.9
Hiptesis:

H0 : = 12.5
Ha : ! 12.5
Nivel de significacin: 5% y 1%.
x ! 0 12.529 ! 12.5
= 0.338
= 0.316
Estadgrafo de contraste: Z =
S
14
n
Valores crticos : para el 5% t0.05= 1,96 para el 1% t0.01= 2,57
p-valor : 0,7571
Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de
aceptacin, por tanto aceptamos la hiptesis nula.
Conclusin no estadstica: La modificacin en el proceso de fabricacin no ha
modificado significativamente el grado alcohlico.
Cuadro 4.9: Aplicacin del contraste para la media de una poblacin Normal con varianza conocida al
problema de la modificacin en el grado alcohlico del vino de Ribera de Duero

Todos los conceptos explicados para el contraste de la media de una poblacin


Normal con varianza conocida siguen siendo vlidos aqu.

tn-1,2 es el valor crtico de la t de Student tal que P( tn-1 > tn-1,2 ) = . Se ha denotado con el subndice

2 porque es el que se utiliza para buscar el valor correspondiente en la tabla.

311

4.5.2.7 Contrastes para muestras grandes


Cuando las muestras de las que se dispone son muestras grandes
(aproximadamente mayores de 30 observaciones) es posible utilizar directamente la
distribucin Normal ya que es muy similar a la t de Student. Adems el teorema central
del lmite permite relajar la hiptesis de normalidad ya que la normalidad de la
distribucin muestral de medias est garantizada, bajo ciertas condiciones de
regularidad, aunque la poblacin original no sea Normal. Hay que tener en cuenta que
se trata slo de una aproximacin y, cuanto mayor es el tamao de la muestra mejor es
la aproximacin Normal obtenida. El procedimiento de contraste para muestras grandes
se muestra en el cuadro 4.10. Mostramos solamente el contraste bilateral ya que los
unilaterales se construyen exactamente de la misma manera que en los casos anteriores.

Hiptesis:

H0 : = 0
Ha : ! 0

Nivel de significacin:
x ! 0
Estadgrafo de contraste: Z =
S
n
Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0, 1)
Regin de aceptacin: {Z / Z ! z "/ 2 }
Regin critica: {Z / Z > z !/ 2 }

Cuadro 4.10: Contraste para la media de una poblacin Normal con varianza desconocida
cuando la muestra es grande.

312

4.5.3 Contraste para la diferencia de


medias de dos poblaciones normales
con datos independientes
4.5.3.1 Planteamiento general
En la investigacin aplicada la situacin ms habitual es aquella en la que se
quieren comparar dos poblaciones a las que se les ha aplicado, por ejemplo, dos
tratamientos diferentes.
Pongmonos en el mismo supuesto que en el ejemplo que sirvi para ilustrar el
contraste para una poblacin, y supongamos que lo que deseamos es conocer si los
vinos de nuestra denominacin de origen tienen el mismo contenido alcohlico que los
de otra denominacin de origen, por ejemplo la de Toro. Se trata de saber si existe una
clara diferenciacin en los mismos ya que, debido a la proximidad geogrfica de ambas
regiones, es posible que haya fraudes y se intercambien vinos de ambas dependiendo
del mercado de los mismos. La hiptesis de trabajo inicial es entonces Existen
diferencias en el grado alcohlico de ambas denominaciones?.
Procediendo de la misma manera que en el caso de una poblacin, suponemos una
distribucin de probabilidad para la poblacin que es la distribucin Normal. En la
primera poblacin (Ribera de Duero) el grado alcohlico sigue una distribucin Normal
N(1, 1); en la segunda poblacin (Toro) el grado alcohlico sigue un Modelo Normal
N(2, 2).
Formulamos a continuacin las hiptesis de trabajo en trminos de los parmetros
de los modelos. Las hiptesis nula y alternativa son ahora
H0 :1 = 2
Ha :1 " 2

(1 ! 2 = 0)
(1 ! 2 " 0)

para el contraste bilateral. Vemos como el contraste de que las medias son iguales es
equivalente al contraste de que la diferencia de medias vale 0.

Supongamos que los datos obtenidos son los siguientes para muestras aleatorias

313

de tamao

n1 = 14 y n2 = 6.

Ribera de Duero
12,8 12,8 12,5 11,9 12,5 12,1 12,2 12,6 13,0 12,4 12,6 12,2 12,8 13,0
Toro
13,0
14,0
13,2
13,4
13,2
13,9
Tabla 4.2: Grado alcohlico de 20 vinos de las denominaciones de origen de Ribera y Toro.

Se supone que las muestras se han obtenido de forma independiente en ambas


denominaciones.
La estadstica descriptiva bsica para ambos grupos aparece en la tabla 4.3.

Tabla 4.3: Descriptiva bsica del grado alcohlico.

Una primera aproximacin a las diferencias entre los dos grupos sera la
construccin de grficos comparativos que muestren la estructura de los mismos, por
ejemplo, un Box-Plot con los grupos separados. (Ver figura 4.17).
Una simple inspeccin visual del grfico nos muestra que hay una clara diferencia
entre los grados de ambas denominaciones, a pesar de que la diferencia muestral es muy
evidente necesitamos un procedimiento ms formal para establecer si las diferencias
observadas pueden ser consideradas estadsticamente significativas. Construiremos el
procedimiento de contraste en varios supuestos comenzando desde el ms sencillo hasta
los ms complejos.

314

Figura 4.24: Box plot para la comparacin del grado alcohlico de las
denominaciones de Ribera y Toro.

4.5.3.2 Varianzas conocidas


Supongamos, para simplificar que las desviaciones tpicas son conocidas, por
ejemplo 1 = 0.5 y 2 = 0.6 para las denominaciones de Ribera de Duero y Toro
respectivamente. Desarrollaremos el procedimiento general para despus aplicarlo a los
datos de los que disponemos.
Conocemos la distribucin de la media muestral en ambas poblaciones.
x1 ! N(1,

"1
)
n1

x2 ! N(2 ,

"2
)
n2

y ambas distribuciones son independientes. El estimador de la diferencia de medias


poblacionales ser la diferencia de medias muestrales y, como la diferencia de normales
independientes es tambin una distribucin Normal, tenemos que
x1 ! x2 " N(1 ! 2 ,

#21 # 22
+
)
n1 n2

315

Estandarizando se obtiene que

Z=

(x1 ! x2 ) ! (1 ! 2 )
"21 " 22
+
n1 n2

# N(0,1)

Cuando la hiptesis nula es cierta 1 ! 2 = 0 y se tiene que

Z=

(x1 ! x2 )
"12 " 22
+
n1 n 2

# N(0,1)

luego Z ser el estadgrafo de contraste que utilizaremos.

El procedimiento de contraste completo se muestra el cuadro 4.11. Solo se incluye


el contraste bilateral ya que la construccin de los correspondientes unilaterales es la
misma que en los casos previos y se deja como ejercicio al lector.
Hiptesis:

H0 :1 = 2
Ha :1 " 2

(1 ! 2 = 0)
(1 ! 2 " 0)

Nivel de significacin:
(x1 ! x2 )
Estadgrafo de contraste: Z =
"12 " 22
+
n1 n 2
Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0, 1)
Regin de aceptacin: {Z / Z ! z "/ 2 }
Regin critica: {Z / Z > z !/ 2 }

Cuadro 4.11: Contraste para la diferencia de medias de dos poblaciones normales con varianza conocida.

Si aplicamos el contraste a los datos del ejemplo, obtenemos los resultados del
cuadro 4.12.

316

Hiptesis:

H0 :1 = 2
Ha :1 " 2

(1 ! 2 = 0)
(1 ! 2 " 0)

Nivel de significacin: = 0.05 (5%) 0.01 (1%)


(12.529 ! 13.450)
Estadgrafo de contraste: Z =
= !10.829
0.25 0.36
+
14
6
Valores crticos : para el 5% z0.025= 1,96 para el 1% z0.005= 2,57
Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin crtica,
por tanto rechazamos la hiptesis nula.
Conclusin no estadstica: La modificacin en el proceso de fabricacin ha aumentado
significativamente el grado alcohlico.
Cuadro 4.12: Contraste para la diferencia de medias de dos poblaciones
normales con varianza desconocida.

4.5.3.3 Varianzas desconocidas pero iguales


Supongamos ahora que las varianzas son desconocidas pero iguales (1 = 2 =
). La distribucin de la diferencia de medias muestrales es ahora

Z=

(x1 ! x2 ) ! (1 ! 2 )
# N(0,1)
1
1
"
+
n1 n 2

Tenemos que eliminar el parmetro , para lo cual utilizaremos las distribuciones


muestrales asociadas a las cuasi-varianzas muestrales

(n1 ! 1)S12
# $ 2n1 !1
2
"

(n 2 ! 1)S 22
# $ 2n 2 !1
2
"

La suma de dos ji-cuadrado es tambin una ji-cuadrado, sumando las dos


anteriores

(n1 ! 1)S12 (n 2 ! 1)S 22 (n1 ! 1)S 12 + (n 2 ! 1)S 22


+
=
# $ 2n1 +n 2 !2
2
2
2
"
"
"

317

Suponiendo que ambas distribuciones son independientes* , podemos combinarlas


para obtener una distribucin t de Student. La variable aleatoria

t=

con S =

(x1 ! x 2 ) ! (1 ! 2 )
1
1
"
+
n1 n 2
(n1 ! 1)S 12 + (n2 ! 1)S 22
"2

n1 + n2 ! 2

(x1 ! x2 ) ! (1 ! 2 )
1
1
S
+
n1 n2

(n1 ! 1)S12 + (n 2 ! 1)S 22


sigue una t de Student con n1 + n2 - 2 grados de
n1 + n 2 ! 2

libertad.
Si la hiptesis nula es cierta, el estadgrafo de contraste que utilizaremos es

t=

(x1 ! x2 )
= t n1 +n 2 !2
S 1 + 1
n1 n 2

Es posible considerar un estadgrafo de contraste alternativo si se utilizan las


varianzas muestrales en lugar de las cuasi-varianzas. Para ello basta tener en cuenta que
las distribuciones muestrales asociadas a las varianzas son

n1 S12
2
2 " # n1 $1
!

n2 S22
2
2 " # n 2 $1
!

El nuevo estadgrafo de contraste es de la forma

t=

con S =

(x1 ! x2 )
= t n1 +n 2 !2
1
1
S
+
n1 n 2

n1 S 12 + n2 S 22
. Los dos estadsticos toman exactamente el mismo valor por lo
n1 + n2 ! 2

que pueden utilizarse indistintamente. Usaremos el calculado a partir de las cuasivarianzas porque son estimadores insesgados de la varianza poblacional.
*

La demostracin puede encontrarse en cualquier libro de Estadstica Matemtica. No se ha incluido aqu


porqwue supera los propsitos de este trabajo.

318

En ambos casos lo que se ha hecho es estimar la varianza comn de ambas


poblaciones mediante una media ponderada de las varianzas estimadas en cada
poblacin, y se ha cambiado la distribucin Normal por la t de Student con el
correspondiente aumento en la dispersin que hace que sea ms difcil encontrar
diferencias.
En este caso es necesario que las varianzas sean iguales para poder despejarlas y
eliminarlas en el clculo del estadgrafo de contraste. La comprobacin de la igualdad
de varianzas se har posteriormente aunque sea un paso previo a la decisin del tipo de
contraste.
Las cuestiones relacionadas con la potencia del contraste se interpretan de la
misma manera que en todos los casos anteriores. Cuanto mayor sea la diferencia que
queremos detectar mayor ser la potencia para detectarla. Cuanto ms pequeo sea el
efecto que queremos detectar mayor ser el tamao de muestra necesario para hacerlo.
Si aumentamos indefinidamente el tamao muestral conseguiremos que la diferencia
muestral sea siempre estadsticamente significativa por pequea que sea.
El contraste completo se muestra en el cuadro 4.13.
H0 :1 = 2 (1 ! 2 = 0)
Ha :1 " 2 (1 ! 2 " 0)
Nivel de significacin:
(x1 ! x2 )
(x1 ! x 2 )

t=
Estadgrafo de contraste: t =
1
1
1
1
S
+
S
+
n1 n 2
n1 n 2

Hiptesis:

(n1 ! 1)S12 + (n 2 ! 1)S 22


n1 S 12 + n2 S 22
S=
n1 + n 2 ! 2
n1 + n2 ! 2
Distribucin del estadgrafo cuando la hiptesis nula es cierta: t de Student
t n1 +n 2 !2

con S =

Regin de aceptacin: t / t ! t n1 +n 2 "2,#

Regin critica: t / t > t n1 +n 2 !2,"

Cuadro 4.13: Contraste para la diferencia de medias de dos poblaciones normales


con varianzas desconocidas pero iguales.

El contraste se ha aplicado a los datos del ejemplo inicial y se han obtenido los
siguientes resultados (ver cuadro 4.14).

319

H0 :1 = 2 (1 ! 2 = 0)
Ha :1 " 2 (1 ! 2 " 0)
Nivel de significacin: = 0.05 (5%) 0.01 (1%)
(12.529 ! 13.450)
Estadgrafo de contraste: t =
= !5.256
1 1
0.359
+
14 6
Valores crticos : para el 5% t18,0.025= 2.101 para el 1% t18,0.005= 2.878

Hiptesis:

Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin crtica,


por tanto rechazamos la hiptesis nula.
Conclusin no estadstica: El grado alcohlico es significativamente diferente en
Ribera de Duero y Toro.
Cuadro 4.14: Contraste para la diferencia de medias de dos poblaciones normales con varianzas
desconocidas pero iguales, aplicado a los datos sobre el grado alcohlico.

4.5.3.4 Varianzas desconocidas y distintas


Supongamos ahora que las varianzas son desconocidas y distintas (1 2) de
forma que ya no es posible eliminar el parmetro en el clculo de la t de Student. Se han
propuesto diversas aproximaciones para la aproximacin de la distribucin del
estadgrafo de contraste. Describiremos aqu la aproximacin de Welch (ver cuadro
4.15). La demostracin completa est fuera de los propsitos de este trabajo.
H0 :1 = 2 (1 ! 2 = 0)
Ha :1 " 2 (1 ! 2 " 0)
Nivel de significacin:
S 12 S 22
Estadgrafo de contraste: t = (x1 ! x2 )
+
n1 n2
Distribucin del estadgrafo cuando la hiptesis nula es cierta: t de Student tf donde
f es el entero ms prximo a
! S12 S 22 $ 2
#
+ &
" n1 n 2 %
f=
2
2 '2
! S12 $
! S 22 $
# &
# &
" n1 %
" n2 %
+
n1 + 1 n 2 + 1

Hiptesis:

Regin de aceptacin: {t / t ! t f," }


Regin critica: {t / t > t f,! }

Cuadro 4.15: Contraste para la diferencia de medias de dos poblaciones normales


con varianzas desconocidas y distintas.

320

4.5.3.5 Contrastes de comparacin de medias para


muestras grandes
Como ya se coment para el caso de una nica poblacin, el teorema central del
lmite permite asignar distribuciones normales a las medias muestrales aunque la
distribucin en la poblacin no sea Normal. Si disponemos de una muestra de tamao
grande y estimamos la varianza poblacional a travs de la cuasi-varianza muestral,
podemos construir un contraste aproximado de comparacin de medias utilizando la
distribucin Normal (ver cuadro 4.16).
H0 :1 = 2 (1 ! 2 = 0)
Ha :1 " 2 (1 ! 2 " 0)
Nivel de significacin:
S 12 S 22
Estadgrafo de contraste: t = (x1 ! x2 )
+
n1 n2

Hiptesis:

Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1)


Regin de aceptacin: {Z / Z ! z "/ 2 }
Regin critica: {Z / Z > z !/ 2 }

Cuadro 4.16: Contraste para la diferencia de medias de dos poblaciones normales


con varianzas desconocidas y tamaos muestrales grandes.

Obsrvese que estamos suponiendo implcitamente que la cuasi-varianza muestral


es un buen estimador de la varianza poblacional, prximo al verdadero valor.

4.5.3.6 Obtencin de datos para la comparacin


de medias.
Dos son los tipos de datos de los que es posible disponer para la comparacin de
las medias
- Datos procedentes de estudios observacionales.
- Datos procedentes de estudios experimentales.
En el primer caso se toman muestras aleatorias en dos poblaciones. La muestra
aleatoria garantiza la representatividad . A este tipo de datos corresponde el ejemplo
que hemos utilizado como gua para la explicacin.

321

Los datos experimentales se corresponden con experimentos planificados en los


que se asignan dos tratamientos distintos a un grupo de individuos. En este tipo de
diseos es necesario que todas las caractersticas que no intervienen en el diseo y
puedan modificar la respuesta, estn controlados y sean similares en los dos grupos a
comparar. Por ejemplo, si se desea hacer un ensayo clnico en el que se dispone de un
grupo de pacientes de forma que a un subconjunto se le aplicar el tratamiento a
comparar y el resto ser utilizado como control sobre el que se utilizar un placebo
(substancia no activa) con la misma apariencia que el tratamiento, los pacientes de
ambos grupos han de ser similares en composicin con respecto a caractersticas como
la edad peso u otros factores que pudieran alterar la respuesta y que no intervienen
directamente en el diseo. Se tratar de evitar sesgos de forma que los efectos puedan
ser asignados a los tratamientos, por ejemplo, en un experimento con ratones de
laboratorio en el que se dispone de dos camadas distintas, no sera correcto asignar un
tratamiento diferente a cada una de las camadas ya que sera imposible separar los
efectos del tratamiento y de la camada. En Estadstica decimos que los tratamientos
estn confundidos.
La forma de asignar tratamientos a individuos para que no existan errores
sistemticos es hacerlo al azar, por ejemplo, sorteando cual es el tratamiento que se
aplica a cada individuo. A este procedimiento se le denomina aleatorizacin, y juega un
papel fundamental en el diseo de experimentos planificados. Hay que hacer notar que
al azar no significa "de cualquier manera" o "cualquiera de los tratamientos", para
conseguir una verdadera aleatorizacin es necesario utilizar la probabilidad.
En los experimentos diseados es muy importante realizar estudios previos sobre
el tamao de muestra necesario para detectar un determinado efecto. Este problema est
fuera del alcance de un curso introductorio aunque las ideas bsicas fueron expuestas
cuando se trat con los intervalos de confianza.
Este tipo de experimentos se comenz en Agricultura para extenderse despus a
otras aplicaciones como la Industria o la Medicina. Actualmente los ensayos clnicos
controlados, basados fundamentalmente en conceptos de Estadstica, forman una parte
importante de la investigacin mdica. Todo el mundo ha odo alguna vez en las
noticias los resultados de ensayos clnicos controlados antes de lanzar al mercado un
nuevo medicamento.

322

4.5.3.7 Contraste para datos apareados.


En el caso de datos independientes en el punto anterior, se dispone de dos
conjuntos distintos de individuos para cada una de las situaciones experimentales que se
quiere compara. Una forma de controlar la variabilidad debida a los propios sujetos
consiste en aplicar todos los tratamientos en estudio a todos los individuos de la muestra
en dos ocasiones diferentes. A este tipo de datos lo denominaremos datos apareados,
relacionados, o ligados y consisten en dos medidas tomadas sobre el mismo conjunto d
individuos en dos ocasiones diferentes.
Para ilustrar los procedimientos utilizaremos datos tomados de MARTN
ANDRS y LUNA CASTILLO (1990).
Supongamos que deseamos saber si la presin sistlica de personas alcohlicas se
modifica cuando dejan el hbito de beber, para ello se toma una muestra de 10 personas
que ingresan en el hospital para tratar su alcoholismo y se toma una medida de la
presin sistlica antes y despus de dos meses de haber dejado de beber. El experimento
fue diseado de esta manera ya que aunque se espera una reduccin en la presin
sangunea, esta depende del valor inicial en cada individuo.
Los resultados obtenidos para la presin sistlica medida en milmetros de
mercurio fueron los siguientes (tabla 4.4):
Individuo

10

Antes

140

165

160

160

175

190

170

175

155

160

Despus

145

150

150

160

170

175

160

165

145

170

Reduccin

-5

15

10

15

10

10

10

-10

Tabla 4.4: datos utilizados en el ejemplo de contraste para datos apareados

Como las variables estn relacionadas, todos los clculos que realizamos en el
caso de datos independientes ya no son vlidos. Para evitar este problema nos
centraremos en una sola variable aleatoria que es la diferencia entre los dos valores
obtenidos para cada uno de los individuos estudiados que mide el efecto del tratamiento
aplicado. Tenemos ahora una nueva variable D que suponemos que tiene una
distribucin Normal de media d desviacin tpica d . La hiptesis de inters es ahora
que, en promedio, el tratamiento aplicado a los individuos es 0, es decir, d = 0. El
contraste es ahora exactamente igual que el descrito para la media de una poblacin
Normal (ahora la poblacin de las diferencias.

323

Describimos a continuacin el contraste para muestras pequeas y varianza


desconocida para datos apareados. Llamaremos d , a la media muestral de las
diferencias y S d a la cuasi desviacin tpica. El contraste se muestra en el cuadro 4.17.

Hiptesis:

H0 : d = 0
Ha :d ! 0

Nivel de significacin:
Estadgrafo de contraste: t =
Sd

n
Distribucin del estadgrafo cuando h0 es cierta: tn-1
Regin de aceptacin: {t / t ! t n "1,# }
Regin critica: {t / t > t n !1," }

Cuadro 4.17: Contraste para la diferencia de medias de dos poblaciones normales con datos apareados.

El resto de los contrastes se construye de la misma manera que en el caso de una


sola poblacin. El cuadro 4.18 muestra ejemplo.

Hiptesis:

H0 : d = 0
Ha :d ! 0

Nivel de significacin: 5% y 1%
6
= 2.250
Estadgrafo de contraste: t = 8.433
10
Distribucin del estadgrafo cuando h0 es cierta: t9
Valores crticos : para el 5% t9, 0.05= 2,262 para el 1% t9, 0.01= 3,250
p-valor : 0,0510
Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de
aceptacin, por tanto aceptamos la hiptesis nula.
Conclusin no estadstica: Con los datos de los que disponemos no existe una
evidencia significativa de que exista una diferencia entre la presin sistlica antes y
despus de haber dejado de beber.
Cuadro 4.18: Contraste para la diferencia de medias de dos poblaciones normales con datos apareados
aplicado al ejemplo de la reduccin de la tensin arterial en alcohlicos.

324

4.5.3.8 rbol de decisiones para la comparacin de


medias de dos poblaciones normales.
La figura siguiente muestra de forma esquemtica el proceso de decisin por el
tipo de contraste a utilizar en poblaciones normales.

325

4.5.3.9 Contraste para la comparacin de la tendencia


central cuando las poblaciones no son normales
En muchas situaciones prcticas es difcil aceptar la hiptesis previa de que los datos
son normales al disponerse, por ejemplo, de distribuciones muy asimtricas. En estos
casos los contrastes anteriores no detectan claras diferencias en el comportamiento de
las poblaciones, debido a que la dispersin es muy grande o debido a que la medida de
tendencia central utilizada (la media) no es la correcta porque est afectada por los
valores extremos. Los contrastes paramtricos descritos antes son especialmente
sensibles a valores extremos de la variable.
Para solucionar el problema se utiliza la mediana en lugar de la media construyndose
los que se denominan contrastes no paramtricos al no referirse ya a parmetros de una
distribucin concreta.

Me1

x1

x2

Me2

En la figura se muestra como para distribuciones asimtricas es mucho ms intuitiva la


comparacin de las medianas que la comparacin de las medias, ya que estas estn
afectadas por los valores muy extremos de la distribucin. La situacin del esquema es
muy tpica, por ejemplo, en problamas mdicos en los que la mayora de los controles
(curva de la izquierda) presentan valores normales de la variable, y solamente algunos
de ellos presentan valores elevados, en el grupo de los pacientes enfremos, la mayora
presenta valores elevados y solamente alguno presenta valores normales. El problema es
particularmente crtico cuando el tamao de muestra es pequeo pero, incluso cuando el
tamao de muestra es grande y se utiliza errneamente el contraste paramtrico

326

correspondiente, se subestima el tamao del efecto a pesar de que la distribucin normal


est correctamente utilizada aplicando el Teorema Central del lmite. La prctica
habitual, especialmente en el mbito mdico, de aplicar contrastes no paramtricos
cuando la muestra es pequea y paramtricos cuando es grande es claramente errnea y
puede llevar a no encontrar efectos experimentales que aparecen claramente definidos
en los datos.
Para la comparacin de medianas de dos poblaciones con datos independientes el
contraste ms utilizado es el conocido como U de Mann-Withney, est basado en la
suma de los rangos de orden de las observaciones de las dos poblaciones consideradas
conjuntamente y consiste bsicamente en calcular todas las ordenaciones posibles con
muestras de los mismos tamaos en el caso de que las medianas fueran iguales, para
comprobar el percentil en el que se encuentra nuestro caso particular. Cabe esperar que
si las medianas de las dos poblaciones son iguales los datos estn mezclados y las
sumas de rangos de orden sean similares en amos grupos. El resto del razonamiento es
similar al de cualquier contraste, si el valor muestral obtenido es muy probable
aceptamos la hiptesis nula y si no la rechazamos.
Para el caso de datos apareados se utiliza el test de Wilcoxon que contrasta la hiptesis
de que la mediana de las diferencias es cero. La base del contraste es similar al caso de
muestras independientes.

Comparacin de medianas de dos poblaciones con datos


independientes: el contraste U de Mann-Withney
Est basado en la suma de los rangos de orden de las observaciones de las dos
poblaciones consideradas conjuntamente y consiste bsicamente en calcular la
distribucin muestral a partir de todas las ordenaciones posibles con muestras de los
mismos tamaos en el caso de que las medianas fueran iguales. Cabe esperar que si las
medianas de las dos poblaciones son iguales los datos estn mezclados y las sumas de
rangos de orden sean similares en ambos grupos.

327

HIPOTESIS:

H 0 : Me1 = Me 2
H a : Me1 " Me 2

(Me 1 ! Me 2 = 0)
(Me 1 ! Me 2 " 0)

ESTADIGRAFO DE CONTRASTE: Ordenar las observaciones, asignar el rango


correspondiente y calcular las sumas de rangos de las observaciones de cada grupo.(R1 y
R2)

n (n + 1)
U = min(U 1 , U 2 ) U i = n 1n 2 + i i
! Ri
2
n n
U! 1 2
2
n 1 n 2 (n 1 + n 2 + 1)
12

Para muestras grandes: Z =

DISTRIBUCION DEL ESTADIGRAFO CUANDO H0 ES CIERTA: Distribucin


emprica o N(0,1) para muestras grandes.
REG. DE ACEP.:

inf
{U / U!;n
,n

sup

1 2

REGION CRITICA:

" U " U !;n ,n


1 2

{Z /

1 2

Z ! z " /2 }

{U / U ![U inf";n ,n ; Usup


";n ,n ]}

{Z /

Z > z ! /2 }

Comparacin de medianas de dos poblaciones con datos apareados: el


test de Wilcoxon
Contrasta la hiptesis de que la mediana de las diferencias es cero. La base del contraste
es similar al caso de muestras independientes.

HIPOTESIS:

H 0 : Me d = 0
H a : Me d ! 0

ESTADIGRAFO DE CONTRASTE: Calcular las diferencias entre los valores de


ambos grupos, Suprimir las observaciones nulas, Ordenar las observaciones en valor
absoluto, asignar el rango correspondiente y calcular las sumas de rangos de las
observaciones positivas y negativas.(T+ y T-)

T = min(T+ , T! )

328

Para muestras grandes: Z =

n(n + 1)
4
n(n + 1)(2n + 1)
24
T!

DISTRIBUCION DEL ESTADIGRAFO CUANDO H0 ES CIERTA: Distribucin


emprica o N(0,1) para muestras grandes.

sup
inf
" T " T!;n }
{T / T!;n
sup
inf
REGION CRITICA: {T / T ![T";n ; T";n ]}
REG. DE ACEP.:

{Z /

Z ! z " /2 }

{Z /

Z > z ! /2 }

4.5.3.10 Comparacin de varias poblaciones.


Introduccin al problema de las comparaciones
mltiples.
En muchas situaciones experimentales se dispone de r >2 poblaciones a comparar.
La primera aproximacin al problema es la comparacin de todas la parejas de medias,
sin embargo, la propia construccin del procedimiento de contraste hace que la
probabilidad de error no se mantenga al realizar todas las comparaciones por parejas.
Supongamos que disponemos de r poblaciones y queremos contrastar la hiptesis
de que todas las medias son iguales

H0 :1 = = i = = r
i, j

La hiptesis es cierta si y solo si las hiptesis por parejas H0 : i = j para todas


! r $ r(r & 1)
las k = # =
combinaciones posibles de i y de j.
" 2%
2
Si contrastamos la hiptesis por separado a un nivel de significacin , tenemos
P(Aceptar

H i,0 j / Hi,0 j

Si las comparaciones fueran independientes

cierta ) = 1 ! "

329

P(Aceptar

H0 / H0

cierta ) = P( ! Aceptar
i!j

Hi,0 j / H0

cierta ) =

cierta ) = (1# $ )k
" P(Aceptar Hi,0 j / Hi,j
0

i!j

es decir, la probabilidad de cometer un error tipo I es


P(Re chazar
= 1 ! P(Aceptar

H0 /

H0 /
H0

H0

cierta ) =

cierta ) = 1 ! (1 ! ") k # "

Por ejemplo, para tres poblaciones en las que se realizan comparaciones


3
individuales al 5%, hay una probabilidad de 1 ! 0.95 = 1! 0.8574 = 0.1426 de
rechazar la hiptesis nula indebidamente. Con 5 poblaciones la probabilidad sera
1 ! 0.9510 = 1! 0.5987 = 0.4013 .
Con 10 poblaciones 1 ! 0. 95

45

= 1 ! 0. 0994 = 0. 9006 , es decir, con 10

poblaciones, aunque todas las medias fueran iguales tendramos una probabilidad del
90% de encontrar diferencias en alguna de las parejas.
Este problema es importante no solo en la comparacin de medias por parejas
sino tambin cuando se quieren realizar muchas comparaciones sobre el mismo
conjunto de datos. Supongamos, por ejemplo, que un investigador desea demostrar que
es capaz de encontrar diferencias entre personas convictas por algn tipo de delito y
personas que no. A tal fin realiza 100 medidas biomtricas como el permetro torcico,
el permetro craneal, etc.... que compara en los dos grupos. En cada comparacin tiene
una probabilidad del 5% de rechazar indebidamente, sin embargo (si las medidas fueran
independientes) tendra una probabilidad del 99,41% de encontrar diferencias en alguna
de las variables. El nmero esperado de contrastes significativos sera de 5.

El problema de mantener el nivel de significacin global en la comparacin de las


medias de varios grupos se soluciona mediante la tcnica denominada Anlisis de la
varianza seguido de las comparaciones por parejas en las que se hace algn tipo de
correccin en el nivel de significacin individual.

330

4.5.3.11 Validacin de las hiptesis de partida.


A lo largo de los distintos puntos de la descripcin de los contrastes bsicos
hemos ido haciendo una serie de suposiciones que no hemos verificado como son las
hiptesis de normalidad o de igualdad de varianzas (homocedasticidad) de las
poblaciones. La validacin de estos supuestos se ha dejado para el final aunque debe
realizarse previamente a la aplicacin de los procedimientos de contraste.
Existen muchos mtodos que permiten la validacin de la hiptesis de
normalidad, desde los ms formales consistentes en nuevos contrastes cuya hiptesis
nula es la hiptesis de que los datos proceden de una distribucin Normal, hasta simples
procedimientos descriptivos como el histograma o el Box-Plot que nos permiten decidir
si la distribucin es aproximadamente simtrica o Normal y si la dispersin de los
grupos en estudio es aproximadamente la misma.
Los procedimientos de contraste de comparacin de medias suelen ser robustos
con respecto a la hiptesis de normalidad aunque muy sensibles a la presencia de
outliers (datos anormalmente grandes o pequeos). En las representaciones Box-plot de
los grupos a comparar buscaremos la simetra de lo grupos y, sobre todo, la presencia de
observaciones extraas en los extremos de la distribucin.
La figura 4.19 muestra el grfico con los Box-Plots correspondientes al ejemplo
de las denominaciones de origen, que hemos analizado previamente

Figura 4.26: Box plot para la comparacin del grado alcohlico de las

331

denominaciones de Ribera y Toro.

El grfico muestra como no hay observaciones muy extremas, las dos


distribuciones tienen aproximadamente la misma dispersin y la correspondiente a la
denominacin de origen de Toro parece ms asimtrica. La asimetra podra ser debida
simplemente a que el tamao muestral es muy pequeo en este grupo.
En lneas generales parece que las hiptesis se verifican y es posible aplicar el
contraste par la igualdad de medias de dos poblaciones normales con varianzas
desconocidas pero iguales.
Para contrastar ms formalmente que las varianzas son iguales se puede construir
un contraste muy simple teniendo en cuenta la distribucin del cociente de varianzas
basado en el cociente de las distribuciones ji-cuadrado asociadas.
El cociente

(n1 ! 1)
"12
(n1 ! 1)
F ==
(n 2 ! 1)S 22
" 22
(n2 ! 1)

S 21 " 22
= 2 2
S2 "1

sigue una distribucin F de Snedecor con n1-1 y n2-1 grados de libertad.


Si la hiptesis nula H0 :!12 = !22 es cierta, el cociente de cuasi-varianzas
S 2
muestrales F = 12 sigue una distribucin F de Snedecor con n1-1 y n2-1 grados de
S
2

libertad.

332

El contraste completo aparece en el cuadro 4.19.

Hiptesis:

H0 :!12 = !22

Ha :!12 " ! 22
Nivel de significacin:
S 2
Estadgrafo de contraste: F = 12
S 2
Distribucin del estadgrafo cuando h0 es cierta: F n1 !1, n 2 !1

Regin de aceptacin: F / F ![Fn 1 "1,n2 "1, 1"#/ 2 ,F n1 "1,n 2 "1, 1"#/ 2 ]

Regin critica: F / F ![Fn 1 "1,n2 "1, 1"#/ 2 ,F n1 "1,n 2 "1, 1"#/ 2 ]

Cuadro 4.19: Contraste de comparacin de las varianzas de dos poblaciones normales.

Para el ejemplo de la comparacin del grado alcohlico en las dos


denominaciones de origen consideradas el contraste de comparacin de varianzas se
muestra en el cuadro 4.20.
Hiptesis:

H0 :!12 = !22
Ha :!12 " ! 22

Nivel de significacin: = 5% y 1%
S12
Estadgrafo de contraste: F = 2 = 0.686
S
2

Distribucin del estadgrafo cuando h0 es cierta: F n1 !1, n 2 !1


p-valor : 0.6261
Conclusin : Se acepta la hiptesis nula.
Cuadro 4.20: Contraste de comparacin de las varianzas de dos poblaciones normales aplicado a la
comparacin de la variabilidad del grado alcohlico.

Como se acepta la hiptesis de igualdad de varianzas, la comparacin de medias


ha de hacerse en el supuesto de que las varianzas son iguales.

El valor F n !1,n !1, 1!" /2 es el valor crtico que deja a la derecha un rea de 1 ! " / 2 . En la
1
2
prctica puede calcularse como F n !1,n !1, 1!" /2 = 1 F n !1, n !1, " / 2
1
2
2
1
*

333

Quinta
Unidad Didctica

"TABLAS DE CONTINGENCIA"

5.1 Parte bsica

334

5.1.1 Introduccin
La existencia de distintas pruebas estadsticas es consecuencia, en parte, de las
distintas escalas de medida que se utilizan para tratar las variables objeto de una
determinada investigacin.
Los investigadores de distintos campos utilizan de modo habitual variables
medidas en escala nominal y pasan buena parte de su tiempo clasificando y contando
individuos. As por ejemplo cualquier individuo puede ser clasificado en categoras
(varn, mujer; enfermo, sano; ausencia, presencia; soltero, casado, viudo, separado).
El resultado de tales clasificaciones da lugar a lo que en la terminologa
estadstica se le conoce como tablas de contingencia o tablas de frecuencias.
Tablas de contingencia son tablas de variables aleatorias cualitativas cuyos
datos estn recogidos en forma de tablas de frecuencias.

El objetivo de este captulo es:


El estudio de diversas cuestiones en relacin a variables aleatorias
cualitativas cuyos datos estn recogidos en forma de tablas de frecuencias: Tablas
de contingencia.
En esencia se pueden a abordar varios tipos de problemas:

1) Test de bondad de ajuste a distribuciones:


Para comprobar si nuestros datos muestrales se ajustan a un determinado
modelo terico. (Ejemplo: Sigue la estatura media de los espaoles una ley
normal?)
2) Test de homogeneidad de varias muestras cualitativas:
Contraste para probar si varias muestras de un carcter cualitativo proceden
de igual poblacin. (Ejemplo: Es la proporcin de parados en Espaa la
misma que en el resto de los pases Europeos?)

335

3) Test de asociacin:
Para comprobar si dos o mas caractersticas cualitativas estn relacionadas
entre s. (Ejemplo: Est la intencin de voto, a un determinado partido
poltico, relacionada con el sexo?).
En el desarrollo del captulo nos vamos a centrar en este ltimo tipo de contrastes.

5.1.2 Nociones generales tiles para su


resolucin
El denominador comn a estos objetivos es que su tratamiento estadstico est
basado en la misma distribucin terica: la distribucin Ji- cuadrado.
El test ji-cuadrado es el estadstico ms apropiado para variables categricas.
Antes de comenzar al desarrollo de los contrastes sealados hemos de sentar unas
ideas que nos permitirn abordar el estudio con mayor facilidad de comprensin.
En toda tabla de contingencia (sea cual sea el objetivo perseguido) podemos
distinguir varios elementos comunes:
Frecuencias observadas: nmero de individuos de nuestra muestra que
pertenece a una de las categoras en las que hemos dividido a nuestra
variable aleatoria (Oi).
Frecuencias esperadas: Nmero de individuos en nuestra muestra que
cabra esperar en cada categora si alguna hiptesis nula de partida fuera
cierta (Ei).

EJEMPLO 5.1:
Supongamos una muestra de 100 individuos de una poblacin en los que estamos
estudiando el estado civil. Esta variable aleatoria puede tener cuatro categoras:
soltero, casado, viudo y divorciado. Supongamos que el nmero de individuos en

336

nuestro estudio ha sido: 50 casados, 30 solteros, 15 viudos y 5 divorciados, estos


nmeros representan nuestras frecuencias observadas.
Solucin:
Nuestra hiptesis de partida (H0) podra ser que las cuatro categoras estn
igualmente representadas. En este caso cabra esperar que nuestra muestra constara de
25 individuos en cada casilla, que se corresponden con nuestras frecuencias esperadas.

frecuencia
Observada

Solteros

Casados

Viudos

Divorciados

30

50

15

25

25

25

25

frecuencia
Esperada

Est claro que si nuestra H0

fuera cierta las frecuencias observadas y las

esperadas discreparan poco y, seran muy diferentes en caso contrario. Se nos plantea
entonces un problema:
Cmo medir las discrepancias?. La forma ms simple de medir divergencias
entre ambas magnitudes sera efectuar la diferencia entre ambas (foi -fei ), en todas y
cada una de las casillas de la tabla y, obtener, de este modo, una magnitud que: si es
grande nos har pensar en rechazar la hiptesis de partida, y si es pequea en aceptarla.
En realidad el estadstico con el que vamos a trabajar se basa en esta idea, si bien tiene algunas
correcciones (no trabaja con diferencias sino con diferencias al cuadrado, para evitar problemas de signos,
y trabaja con discrepancias normalizadas, obtenindolas en valores relativos).

Estadgrafo de contraste:

!2 = #
i

(fo i " fe i )2
fei

foi= Frecuencia observada para la i-sima categora


fei= Frecuencia esperada para la i-sima categora

337

El siguiente problema que se nos plantea: qu entendemos por magnitud


grande? Necesitamos un criterio uniforme para declarar rechazos o aceptaciones.
Pearson nos soluciona este problema demostrando que el estadgrafo de
contraste propuesto segua un modelo terico:
Una Ji-cuadrado con (r-1)(s-1) grados de libertad, cuando la hiptesis nula se
verificaba. (Siendo r= n de filas de la tabla y s= n de columnas de la tabla).
De este modo el criterio de decisin ya est establecido, declararemos
rechazo, es decir declararemos diferencias grandes, cuando nuestro valor
del estadgrafo experimental supere al valor crtico encontrado en la
tabla de la distribucin Ji-cuadrado con esos grados de libertad, al
nivel de significacin elegido.
Recurdese que un valor crtico no es ms que un valor de la variable aleatoria que slo es
superado por un porcentaje pequeo, preestablecido de antemano, de individuos cuando la hiptesis nula
es cierta

5.1.3 Test de asociacin en tablas de


contingencia
Es frecuente el problema de estudiar conjuntamente dos variables en los
mismos individuos y preguntarse si existe algn tipo de relacin entre ellas, es decir
si los valores que tome una de ellas van a condicionar de algn modo los valores que
tome la otra. Cuando las dos variables son cuantitativas hemos visto que son las
tcnicas de regresin y correlacin las que nos permiten resolver el problema, pero
estas tcnicas dejan de ser vlidas cuando las dos variables en estudio son
cualitativas. Este apartado pretende dar solucin a dicha situacin. Para resolver este
problema vamos a explicarlo mediante un ejemplo.

338

EJEMPLO 5.2:
Supongamos cuatro tratamientos (Ai) que se piensa efectivos para curar una
determinada enfermedad, estos tratamientos se aplican a enfermos de dicha
enfermedad y se anota el tipo de respuesta que presentan (Bj). La respuesta se clasifica
en tres posibles clases: "peor", "igual", "mejor". Ejemplo tomado de MARTN
ANDRS, A. et al. (1995).

Peor

Igual

mejor

TOTAL

Trat 1

f11

28 f12

115 f13

150 f1.

Trat 2

15 f21

20 f22

85 f23

120 f2.

Trat 3

10 f31

30 f32

90 f33

130 f3.

Trat 4

f41

40 f42

115 f43

160 f4.

37 f .1

118 f.2

405 f.3

560 f..

TOTAL

fi. = Total fila i


f.j = Total columna j
f.. = Gran total
Solucin:
Disponemos de nuestra tabla de frecuencias observadas, se necesita establecer una
hiptesis de partida que nos permita el clculo de las correspondientes frecuencias
esperadas. La hiptesis de la que se parte es la hiptesis de independencia, es decir
vamos a suponer que ambos caracteres no estn relacionados (no estn asociados).
Si denotamos:
Ai= Suceso de que un individuo pertenezca a la clase i de A
Bj= Suceso de que un individuo pertenezca a la clase j de B
Podemos escribir las hiptesis como:
Ho: Los caracteres A y B son independientes bien los caracteres A y
B no estn relacionados los caracteres A y B no estn asociados
Ha: Son dependientes, relacionados, asociados

339

En nuestro ejemplo:
Ho: El tipo de tratamiento no condiciona la respuesta del individuo.
Ha: Si condiciona.

Si ambas caractersticas son independientes podemos escribir las hiptesis de la


siguiente forma:

(
)
( )
Ha:P( Ai ! Bj ) # P( Ai ) P( Bj ) en alguna ocasin
Ho:P Ai ! B j = P(A i ) P B j "i, j

Es decir bajo el supuesto de independencia, y slo en este supuesto, la


probabilidad de la interseccin de dos sucesos es el producto de probabilidades de
ambos sucesos
Obtencin de las feij: Como en todo test Ji-cuadrado necesitamos las cantidades
esperadas bajo el supuesto de que H0 se verifique. Fijmonos en una cualquiera de ellas
por ejemplo en la E21: Cantidad de individuos que habiendo recibido el tratamiento 2
empeoran supuestas ambas independientes.
Si Ho es cierta:

fe 21 = f .. P(A2 )P(B1 )

Para su clculo necesitamos P(A2) , es decir la probabilidad de los individuos a


recibir el tratamiento 2, y la P(B1) es decir la probabilidad de los individuos de
empeorar. Ntese que en la frmula aparecen, ademas de estas dos probabilidades el
total global. El total global es necesario para pasar de probabilidades a frecuencias
Ambas probabilidades son desconocidas pero estimables a partir de la tabla
(casos favorables entre casos totales). A los correspondientes estimadores de las
probabilidades les vamos a denotar con: p ij

p(A2 ) =

120 f 2.
=
560 f..

p(B1 ) =

37 f.1
=
560 f ..

340

f f.
f f
fe 21 = f .. P (A2 ) P (B1 ) = f .. 2. 1 = 2. .1 = 7.93
f.. f ..
f ..

De donde se desprende la regla general que nos permitir calcular la frecuencia


esperada de cualquiera de las casillas de la tabla:
feij= (Total fila i-sima)(Total col. j-sima)/Total global
Sin ms que aplicar esta frmula general obtendremos la tabla de frecuencias
esperadas:

Trat 1
Trat 2
Trat 3
Trat 4
TOTAL

Peor
7
9.91
15
7.93
10
8.59
5
10.57
37

Igual
28
31.61
20
25.28
30
27.39
40
33.72
118

mejor
115
108.48
85
86.79
90
94.02
115
115.71
405

TOTAL
150
120
130
160
560

Obtencin de la cantidad experimental: Para medir las discrepancias entre


ambas utilizamos el estadgrafo de contraste adecuado que como veamos era:

! 2exp =

##
i

( foij " fe ij)

fe ij

En nuestro ejemplo concreto este valor resulta ser:


2
! exp

(7 " 9.91)2
9. 91

+... +

(115 "115. 71)2


15. 71

= 13.87

Ya sabemos que valores grandes nos llevaran a rechazar la hiptesis de


independencia, y los pequeos a aceptarla. Sabemos tambin que la regla de decisin
est clara pues basta con buscar el valor crtico en la tabla de la Ji-cuadrado ( con los
grados de libertad adecuados, y al nivel de significacin deseado, 5% por ejemplo), y

341

comparar nuestro valor experimental con l. Declararemos significacin siempre que el


valor experimental supere el valor crtico.
H

2
! exp
""o# ! $2 , %

! = (r "1)(s " 1) = 2x3 = 6

! 0.2 05,6 = 12. 59


12.59<13.87 , por tanto Rechazo Ho
En nuestro caso concreto son 6 los grados de libertad y 12.59 el valor crtico.
El valor experimental, 13.87, supera al valor crtico.
Conclusin: El tipo de tratamiento condiciona el tipo de respuesta
encontrada en el paciente. No podemos suponer independencia de las dos variables
en estudio.

En resumen, los pasos a seguir en este tipo de anlisis son:

1 Clculo individual de las frecuencias esperadas que cabra esperar si H0 fuera


cierta. La hiptesis de la que partiremos es siempre la de independencia entre las
dos variables, ya que slo bajo este supuesto conocemos la distribucin del estadgrafo
de contraste (distribucin ji-cuadrado de Pearson)
2
2 Clculo de los componentes individuales de ! , es decir clculo de las
divergencias entre observadas y esperadas para cada casilla.
3 Suma de los valores obtenidos en el apartado anterior y obtencin , de esta
forma, del valor experimental de nuestro estadgrafo de contraste.
4 Determinacin de los grados de libertad de la forma (r-1)(s-1)
2
5 Obtencin del valor crtico en la tabla de la distribucin ! con los grados de
libertad correspondientes y decidir si el estadstico calculado en el paso 3 excede este
valor crtico con p=0.05 o bien con p=0.01
6 Concluir en consecuencia. Es decir, hablar de que existe o no asociacin entre
ambas variables segn el valor experimental exceda o no al valor crtico.

342

"TABLAS DE CONTINGENCIA"
5.2 Ampliacin

343

5.2.1 Aspectos de inters.


5.2.1.1 Tipo de contraste
- Se trata de un contraste unilateral superior y esto es as siempre que
trabajemos con tablas de contingencia (sea cual sea el objetivo a cubrir), se debe a la
forma del estadgrafo empleado. Si fuera bilateral rechazaramos H0 para valores muy
grandes y muy pequeos del estadgrafo de contraste, pero valores pequeos, se
interpretan como gran parecido entre ambos tipos de frecuencias. Por tanto no nos
interesa rechazar en los dos sentidos, sino slo en el caso de valores anormalmente
grandes.

5.2.1.2 Tablas poco ocupadas


- Una problemtica ampliamente tratada en los libros de texto es el de las tablas
poco ocupadas o tablas con valores de frecuencias prximos a cero. Cuando nos
encontremos en esta situacin hay que estar prevenidos porque representan un
problema de posible incremento en el riesgo tipo I. Se recomienda tenerlo en cuenta
para frecuencias menores o iguales a 5. Si observamos la frmula del estadgrafo de contraste
podemos ver cmo las frecuencias esperadas van en el denominador. Frecuencias pequeas nos darn, al
ir el en denominador, valores altos en el estadgrafo de contraste, lo que nos llevar, con mayor
probabilidad, a rechazar la Ho, aunque sea cierta. Es decir, a un serio incremento en el riesgo tipo I
probabilidad de rechazar indebidamente la Ho.

5.2.1.3 Causas de la significacin


- El test empleado nos mide discrepancias a nivel global, pero no nos informa
acerca de dnde estn las discrepancias. Basta que en una sola casilla de la tabla se den
grandes discrepancias para obtener valores experimentales grandes que nos llevarn a rechazar la
hiptesis, por tanto ante una magnitud grande no podremos saber si slo una, dos o todas las casillas
discrepan.

Necesitamos un procedimiento posterior que nos ponga de manifiesto dnde

estn realmente las discrepancias: Bsqueda de las causas de la significacin.

344

5.2.2 Bsqueda de las causas de la


significacin
Cuando un test

! 2 da no significativo, es decir aceptamos la H0 de

independencia entre las variables, el problema acaba ah, pero, si la significacin se


produce, lo inmediato es intentar localizar la causa de la misma.
La idea ahora es la descomponer la tabla original en subtablas que nos expliquen
2
las causas de la significacin. Para ello nos basamos en la propiedad aditiva de la ! .

5.2.2.1 Propiedad aditiva de la Ji-cuadrado


2

La propiedad aditiva de la ! dice:

! "21 + ! 2" 2 = ! "21 + " 2


Es decir: si tenemos dos variables aleatorias que siguen respectivamente un
modelo terico Ji-cuadrado con !1 y !2 grados de libertad, la suma de las dos nos da
otra variable aleatoria que sigue un modelo Ji-cuadrado con la suma de los grados de
libertad de las de partida.

5.2.2.2 Bsqueda de las causas de la significacin


El modo de partir la tabla original no es nico y slo el anlisis detallado de los
datos nos dar las pautas a seguir.
Para el desarrollo de este apartado utilizaremos el ejemplo visto con los alumnos,
dado que all la conclusin a la que se llegaba era la de relacin entre ambas variables.
La primera idea que se nos ocurre para analizar la situacin es saber lo que
contribuye cada casilla al valor experimental (recordar que el rechazo se obtena para
valores grandes de ste y, que bastaba que una casilla tuviera grandes discrepancias
para producirse este hecho). De esta manera calcularemos la tabla de contribuciones,
donde los valores de cada casilla se obtienen como:

345

(fo i ! fe i )2
fe i

En nuestro caso concreto:

Tabla de contribuciones
Peor
0.85
6.31
0.23
2.94

Trat 1
Trat 2
Trat 3
Trat 4

Igual
0.41
1.11
0.25
1.17

mejor
0.39
0.04
0.17
0.00

TOTAL
1.65
7.46
0.65
4.11
13.87

Donde el primer elemento de la primera columna se ha obtenido como:

(7 ! 9.91) 2
9.91

= 0.85

El primer elemento de la segunda columna como:

(28 ! 31.61)2
31.61

= 0.41 etc.

El anlisis de la tabla nos sugiere que el principal responsable de la significacin


es el tratamiento 2 con una contribucin total de 7.46, superior a la de los otros 3
conjuntamente.
Esto parece sugerir que los tratamientos 1,3,4 son homogneos entre si (la
respuesta es independiente de estos tratamientos) y difieren del 2.
De ah que intentemos realizar estos dos contrastes:
Primero: Los tratamientos 1,3,4 son homogneos
Segundo: Los tratamientos anteriores difieren del 2
Para llevar a cabo el primero de ellos construimos una subtabla en la que hemos
de eliminar el tratamiento 2 (el aparentemente responsable de la significacin):

T1

PEOR
7

IGUAL
28

MEJOR
115

TOTAL
150

346

T3
T4
TOTAL

10
5
22

30
40
98

90
115
320

130
160
440

En dicha tabla realizaremos el contraste de independencia del mismo modo a


como lo hicimos en la tabla original, con la esperanza de que en este caso la conclusin
sea la de aceptar la Ho (lo que sugiere la observacin de los datos).
Ahora las frecuencias esperadas no van a coincidir con el primer supuesto ya que
los marginales de columnas son distintos (hemos eliminado a los enfermos tratados con
el segundo de los tratamientos), tampoco coincidir el valor experimental ni los grados
de libertad de la tabla.
Siguiendo los pasos enunciados en el ejercicio de los alumnos obtenemos para
este caso:

2
! exp = 5. 04 que hemos de comparar con el correspondiente valor crtico de la
tabla en este caso con 4 grados de libertad, que result ser en este caso
2
! 4;0.05 = 9.488

Concusin: ACEPTO Ho : HOMOGENEIDAD


Como era de esperar hemos llegado a la conclusin de que estos tres tratamientos
eran igualmente efectivos. Por tanto no se trata de tres tratamientos distintos sino de uno
slo que llamaremos a partir de ahora tratamiento (1+3+4).

Para llevar a cabo el segundo de los contrastes, que nos ponga de manifiesto que
es el tratamiento 2 el que difiere del resto necesitamos construir otra subtabla en la que
se disponga de la informacin que nos interesa, es decir el tratamiento 2 y el tratamiento
(1+3+4).

347

PEOR
15
22
37

T2
T(1+3+4)
Total

IGUAL
20
98
118

MEJOR
85
320
405

Total
120
440
560

Realizado el contraste de independencia en esta subtabla obtenemos:


2
! exp = 9.488 que hemos de comparar con un valor crtico, correspondiente a esta
2
situacin, con 2 grados de libertad. Dicho valor es: ! 2;0.05 = 9.21

La conclusin a la que llegamos es pues: Rechazo la H0 de independencia


entre la respuesta y los dos tratamientos el 2 cualquiera de los otros.

Obsrvese que la descomposicin realizada de la tabla original es lcita puesto que


se verifica la propiedad aditiva de la Ji-cuadrado. Hemos obtenido dos subtablas en la
que las sumas de sus grados de libertad (4 y 2 respectivamente) coinciden con los
grados de libertad de la tabla de partida (6).
En resumen lo que hemos hecho es:

Variacin

g.l.

! 2exp.

significacin

5.04

No

9.48

**

14.52

13.87

**

tratamientos
1,3,4
tratamientos
2 y (1+3+4)
Sumas
tratamientos
1,2,3,4

Con esta descomposicin hemos probado que el tratamiento 2 difiere del resto
como pareca intuirse de la tabla de contribuciones, pero esta afirmacin, aunque vlida
no deja de ser incompleta ya que nada nos dice de en qu sentido es diferente, dicho de
otra forma, difiere el tratamiento 2 del resto porque es peor o porque es mejor. Faltara,

348

pues, descomponer la ltima tabla que nos dio significativa, y que tena dos grados
de libertad, en otras dos subtablas de 1 grado de libertad cada una para saber el sentido
de las diferencias.
Un esquema global de los pasos pueden verse en la figura 5.1.
P

T1
P
T1

T3

T4

T2

T3
T4

NS

T2
NS
T1+T2+T3

T2

(I+M)

T1+T2+T3
T2

*
T1+T2+T3

Figura 5.1: Esquema de descomposicin de la tabla de contingencia de partida


para la bsqueda de la significacin

349

5.2.3 Paradoja de Simpson


Supongamos que se realiza un experimento para comparar un nuevo tratamiento
para cierta enfermedad con el tratamiento estndar para esa enfermedad. En el
experimento se tratan 80 individuos que padecen la enfermedad, 40 recibieron el nuevo
tratamiento y 40 recibieron el estndar. Despus de un tiempo se observa cuantos de los
individuos de cada grupo han mejorado y cuantos no. Supongamos que los resultados
fueron:
TODOS LOS PACIENTES

MEJORAN

NO MEJORAN

NUEVO TRATAMIENTO

20

20

TRAT. ESTNDAR

24

16

De acuerdo con la tabla, 20 de los 40 individuos que reciben el nuevo tratamiento


mejoraron y 24 de los 40 individuos que recibieron el estndar mejoraron. Por tanto el
50% de los individuos mejoraron con el nuevo tratamiento, mientras que el 60% de los
individuos mejoraron con el tratamiento estndar. El nuevo tratamiento parece inferior
al tratamiento estndar.
Para investigar la eficacia del nuevo tratamiento ms a fondo, se podra comparar
con el tratamiento estndar slo para los hombres de la muestra y separadamente slo
para las mujeres. Podramos pues desagregar esta tabla en otras dos subtablas: la de
hombres y la de mujeres.
Supngase que tenemos informacin suficiente para construir estas subtablas y
que el resultado es el siguiente:
SOLO HOMBRES

MEJORAN

NO MEJORAN

NUEVO TRATAM

12

18

TRAT. ESTNDAR

SOLO MUJERES

MEJORAN

NO MEJORAN

NUEVO TRATAM

TRAT. ESTNDAR

21

350

Obsrvese que si agregamos de nuevo las dos subtablas obtendramos de nuevo la


tabla de partida.
Sin embargo, el anlisis de las subtablas nos pone de manifiesto algo
sorprendente, ya que el nuevo tratamiento parece ser ms efectivo que el estndar tanto
en hombres como en mujeres. Especficamente, el 40% de los hombres (12 de cada 30)
que reciben el nuevo tratamiento mejoraron, pero slo el 30% de los hombres (3 de cada
10) que recibieron el estndar mejoraron. Adems el 80% de las mujeres (8 de cada 10)
que recibieron el nuevo tratamiento mejoraron pero slo el 70% de ellas (21 de cada 30)
que recibieron el tratamiento estndar mejoraron.
Est claro que la tabla inicial y las subtablas proporcionan resultados
contradictorios. De acuerdo con la primera el tratamiento estndar es mejor para todos
pero con las subtablas, el nuevo es superior, para hombres y para mujeres. A este tipo
de resultados se le conoce como paradoja de Simpson.
La paradoja de Simpson no es realmente una paradoja, slo es un resultado
que sorprende y confunde cuando no se ha observado antes. Se puede ver en la
subtabla correspondiente a mujeres que stas tienen una tasa de recuperacin de la
enfermedad mayor que la de los hombres, independientemente del tratamiento que
reciban. Adems, entre los 40 hombres de la muestra, 30 recibieron el nuevo
tratamiento y slo 10 el estndar, mientras que para las mujeres estos nmeros son
justamente al revs. Por tanto aunque los nmeros de hombres y de mujeres en el
experimento fueron iguales, una alta proporcin de mujeres y una baja proporcin de
hombres recibieron el tratamiento estndar. Puesto que las mujeres tienen una tasa de
recuperacin mayor, se encuentra en la tabla agregada que el tratamiento estndar
manifiesta una mayor tasa global de recuperacin que el nuevo tratamiento.
La paradoja de Simpson demuestra de una forma drstica los peligros de
realizar inferencias a partir de tablas agregadas.
Para estar seguros de que la paradoja no est presente en un experimento las
proporciones de relativas de hombres y de mujeres entre los individuos que reciben el
nuevo tratamiento debe ser aproximadamente la misma, as como las proporciones
relativas de hombres y de mujeres entre los individuos que reciben el tratamiento
estndar.
La posibilidad de la paradoja subyace en cualquier tabla de contingencia. An
cuando se tuviera cuidado al disear un experimento particular de forma que no pudiera

351

ocurrir la paradoja cuando se desagrega para hombres y mujeres, siempre es posible que
exista alguna otra variable, como la edad de los individuos o la intensidad y grado de
avance de la enfermedad, con respecto a la cual la desagregacin podra conducir a una
conclusin directamente opuesta a la indicada por la tabla agregada.

También podría gustarte