Documentos de Académico
Documentos de Profesional
Documentos de Cultura
5 Contrastes PDF
5 Contrastes PDF
"CONTRASTES DE HIPTESIS"
277
278
279
x!
Z= "
con n > 30
sigue una distribucin normal N(0,1), por lo que puede utilizarse sta variable como un
estadstico de contraste, ya que se conoce su distribucin.
280
Decisin
Hiptesis
cierta
Ho
H1
Aceptar Ho
Rechazar Ho
Correcta
Error tipo I
Error tipo II
Correcta
4.4.2.5 Nivel
contraste
de
significacin
potencia
del
y se
281
282
Estos son los conceptos iniciales que deben tenerse en cuenta en un contraste de
hiptesis.
283
x!
Z= " o
n
seguir, cuando la hiptesis nula sea cierta una distribucin normal estndar N(0,1). Se
puede utilizar as pues sta variable como estadstico de contraste en ste caso.
284
1-!
nivel de significacin
!/2
!/2
-z!/2
Regin crtica
z!/2
Regin de
Aceptacin
Regin crtica
1- !
0
Regin de
Aceptacin
nivel de significacin
z!
Regin crtica
285
Z=
x ! o
s
es una variable que sigue una distribucin normal estndar N(0,1), por lo que el
razonamiento es idntico al caso anterior.
MUESTRAS PEQUEAS
Estadgrafo de contraste:
Si el tamao de la muestra es pequeo (n < 30), sabemos de unidades anteriores
que la variable
t=
x ! o
s
n !1
286
distribucin de la variable t, que sigue una distribucin t con n-1 grados de libertad,
sern aquellos valores mayores que t/2,n-1 en el contraste bilateral, o que t,n-1 en el
contraste unilateral.
Las regiones crticas sern pues, anlogamente al caso de la varianza poblacional
conocida, los siguientes (ver figuras 4.4 y 4.5):
nivel de confianza
!/2
-t !/2
Regin crtica
!/2
1"!
0
Regin de
Aceptacin
nivel de significacin
t !/2
Regin crtica
287
Z=
x1 ! x2
"12 " 22
+
n1 n 2
288
que, en el caso de que la hiptesis nula sea cierta (1 = 2 ), se distribuye como una
distribucin normal estndar N(0,1), y, por lo tanto, puede utilizarse como estadstico de
contraste, dado que conocemos su distribucin.
Regin crtica:
La regin crtica estar formada por los valores de Z elevados, tanto positivos
como negativos. Para especificar cuando se consideran elevados, teniendo en cuenta la
distribucin de Z, sern aquellos que sean mayores, en valor absoluto, que Z/2, en el
contraste bilateral, o que z en el contraste unilateral.
estndar
Z=
( x1 ! x2 ) ! (1 ! 2 )
1
1
S
+
n1 n2
Z=
( x1 ! x2 )
S
1
1
+
n1 n 2
289
se distribuye como una distribucin normal estndar, por lo que se puede utilizar como
un estadstico de contraste.
Regin crtica:
La regin crtica se determina igual que en el prrafo anterior, es decir, para los
valores de Z mayores, en valor absoluto, que z/2 (contraste bilateral), o que z
(contraste unilateral).
MUESTRAS PEQUEAS
Estadgrafo de contraste
Pero, si las muestras son pequeas (n1 + n2 < 30), entonces la variable siguiente
t=
con S =
(x1 ! x2 ) ! (1 ! 2 )
1
1
S
+
n1 n2
grados de libertad.
Si la hiptesis nula es cierta, el estadgrafo de contraste que utilizaremos es
t=
(x1 ! x2 )
1
1
S
+
n1 n 2
290
4.4.5 Contraste
binomiales
para
distribuciones
Hiptesis de partida
En ste caso, la hiptesis nula ser:
Ho : p = p o
y la hiptesis alternativa puede ser:
Ha : p po en el contraste bilateral,
o bien Ha : p > po , en el contraste unilateral (tambin Ha : p < po).
Estadgrafo de contraste:
Como conocemos que la distribucin binomial B(n, p) se aproxima mediante una
variable normal N(np, npq ), entonces, se verifica que la variable
p ! p o
Z=
p (1 ! p )
n
se distribuye como una distribucin normal estndar N(0,1).
291
Regin crtica:
La regin crtica, ahora, ser la determinada por los valores de la variable Z que
son mayores en valor absoluto que z/2 , en el contraste bilateral, o bien, mayores que
z , en el contraste unilateral.
Hiptesis de partida:
La hiptesis nula ser:
Ho : p 1 = p 2
mientras que la hiptesis alternativa puede ser :
Ha : p 1 p 2
Estadgrafo de contraste:
Ahora, teniendo en cuenta las propiedades de las distribuciones normales, por las
que se aproximan las binomiales, se verifica que la variable
Z=
! !
p1 ! p2
!
!
!
!
p1(1 ! p1) p2 (1 ! p 2 )
+
n1
n2
se distribuye, cuando la hiptesis nula es cierta, como una distribucin normal estndar
N(0,1)
Regin crtica:
292
293
"CONTRASTES DE HIPTESIS"
4.5 Ampliacin
294
295
H0 = = 0 = 12.5
La hiptesis nula suele ser la de igualdad del parmetro a un nico valor concreto
o procedente de la hiptesis de trabajo.
Junto con la hiptesis nula planteamos la que denominamos hiptesis alternativa
(Ha o H1) que ser aceptada cuando se rechace la nula y viceversa. Por el momento
tomaremos la ms sencilla, la hiptesis e que la media es diferente de 12 que resultar
en un contraste bilateral.
Ha = ! 0 = 12.5
Trataremos de disear un procedimiento para decidir entre ambas hiptesis a
partir de la informacin contenida en una muestra de tamao n, por ejemplo 14
observaciones.
296
RIBERA DE DUERO
12,8 12,8 12,5 11,9 12,5 12,1 12,2 12,6 13,0 12,4 12,6 12,2 12,8 13,0
Tabla 4.1: Grado alcohlico de 14 vinos de la denominacin de Ribera de Duero.
La primera cuestin que hemos de tener en cuenta es que la decisin por una
hiptesis concreta ha de tomarse con un cierto riesgo de equivocarse al no disponer de
la informacin de todos los individuos de la poblacin. Trabajaremos con la media
muestral como estimador de la media poblacional desconocida. En el ejemplo la media
muestral es de 12,529, que como ya sabemos no coincide con la media poblacional.
Trataremos de decidir entre las dos hiptesis a partir del valor de la media
muestral pero, si la media muestral no coincide con la media poblacional, ser la
diferencia entre el valor observado y el terico lo suficientemente grande como para
rechazar la hiptesis nula? o la diferencia observada es lo suficientemente pequea
como para ser debida simplemente al azar o al desconocimiento de la poblacin?.
Daremos respuesta a ambas preguntas utilizando los conceptos sobre distribuciones
aprendidos en temas anteriores.
conocida. Sabemos que la media muestral para distintas muestras sigue una distribucin
!
) , luego, cuando la hiptesis nula es cierta
Normal N(,
n
x ! N(0 ,
"
)
n
297
x ! N( 0 , " )
n
298
299
tpica. No es lo mismo una diferencia de una unidad en una escala de centmetros que en
una escala de kilmetros.
300
Hiptesis
H0 : = 0
Ha : ! 0
Nivel de significacin:
x !
Estadgrafo de contraste: Z = " 0
n
Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1)
Regin de aceptacin: {Z / Z ! z "/ 2 }
Regin critica: {Z / Z > z !/ 2 }
Cuadro 4.2: Contraste para la media de una poblacin Normal con varianza conocida.
Una vez que hemos determinado la forma general del contraste pasamos a
aplicarlo a los datos del problema inicial que nos ocupa (ver cuadro 4.3).
Hiptesis:
H0 : = 12.5
Ha : ! 12.5
Nivel de significacin: 5% y 1%.
x !
12.529 ! 12.5
= 0.217
Estadgrafo de contraste: Z = " 0 = 0.5
n
14
Valores crticos : para el 5% z0.025= 1,96 para el 1% z0.005= 2,57
Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de
aceptacin, por tanto aceptamos la hiptesis nula.
Conclusin no estadstica: La modificacin en el proceso de fabricacin no ha
modificado significativamente el grado alcohlico.
Cuadro 4.3: Aplicacin del contraste para la media de una poblacin Normal con varianza conocida al
problema de la modificacin en el grado alcohlico del vino de Ribera de Duero
Una vez que hemos tomado la decisin final, no sabemos si es correcta o no,
simplemente esperamos que sea del 95% de las muestras en las que aceptamos la
hiptesis correctamente. Si aceptamos la hiptesis nula no quiere decir que sea cierta y
el grado medio sea exactamente de 12.5 grados (probablemente no lo es), sera ms
correcto interpretar que, con la informacin de la que disponemos no hemos encontrado
evidencia suficiente de que la media sea distinta de 12.5. Evidentemente, los valores
muestrales son compatibles con muchos otros posibles valores tericos.
Si aumentamos el tamao de muestra indefinidamente, la variabilidad de la media
301
sera cada vez menor y conseguiramos que la pequea diferencia observada sea lo
suficientemente grande como para considerarla significativa. Es por esto por lo que en
Estadstica decimos que es tan malo tener un tamao de muestra demasiado alto como
tenerlo demasiado bajo ya que en el primer caso cualquier pequea diferencia es
considerada como significativa mientras que en el segundo no se declara significacin
incluso en el caso en el que la diferencia sea elevada.
12.762. La
302
Figura 4.17: Clculo de la potencia del contraste para una alternativa predeterminada.
303
para el ejemplo del grado alcohlico, n> 1141,97, es decir, para que la diferencia
observada fuera significativa tendramos que haber recogido ms de 1142 observaciones
lo que da una idea de que la diferencia observada es muy pequea y, por tanto es muy
probable que la hiptesis nula sea cierta.
304
305
Hiptesis
H0 : = 0
Ha : > 0
Nivel de significacin:
x !
Estadgrafo de contraste: Z = " 0
n
Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1)
Regin de aceptacin: {Z / Z ! z "/ 2 }
Regin critica: {Z / Z > z !/ 2 }
Cuadro 4.4: Contraste unilateral superior para la media de una poblacin Normal con varianza conocida.
306
Ha : < 0
Nivel de significacin:
x !
Estadgrafo de contraste: Z = " 0
n
Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1)
Regin de aceptacin: {Z / Z ! z "/ 2 }
Regin critica: {Z / Z < z !/ 2 }
#
x ! 0 &
p-valor: P% Z >
(
"
$
n '
Cuadro 4.5: Contraste unilateral inferior para la media de una poblacin Normal con varianza conocida.
La decisin por el tipo de contraste debe hacerse a priori, antes de tomar los datos.
Supongamos, por ejemplo, que sospechamos, antes de realizar el experimento, que la
modificacin en el proceso de fabricacin, aumenta el grado alcohlico. El
procedimiento de contraste para los datos de la tabla 1 se muestra en el cuadro 4.6.
307
Hiptesis:
H0 : = 12.5
Ha : > 0
Nivel de significacin: 5% y 1%.
x !
12.529 ! 12.5
= 0.217
Estadgrafo de contraste: Z = " 0 = 0.5
n
14
Valores crticos : para el 5% z0.025= 1,65 para el 1% z0.005= 2,33
p-valor: 0.4129
Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de
aceptacin, por tanto aceptamos la hiptesis nula.
Conclusin no estadstica: La modificacin en el proceso de fabricacin no ha
aumentado significativamente el grado alcohlico.
Cuadro 4.6: Aplicacin del contraste para la media de una poblacin Normal con varianza conocida al
problema de la modificacin en el grado alcohlico del vino de Ribera de Duero
308
t=
x ! 0
"
x !
n
= 0
S
(n ! 1)S 2
n
"2
(n ! 1)
309
Hiptesis
H0 : = 0
Ha : ! 0
Nivel de significacin:
x ! 0
Estadgrafo de contraste: t =
S
n
Distribucin del estadgrafo cuando la hiptesis nula es cierta: tn-1
Regin de aceptacin: {t / t ! t n "1,# }
Regin critica: {t / t > t n !1," } *
Cuadro 4.7: Contraste para la media de una poblacin Normal con varianza desconocida.
x "
t = 0 # t n"1
s
n
1"!
!/2
!/2
-t !
t!
tn-1, es el valor crtico de la t de Student tal que P(-tn-1, tn-1 tn-1, ) = 1-. Se ha denotado con el
310
Hiptesis
H0 : = 0
Ha : > 0
Nivel de significacin:
x ! 0
Estadgrafo de contraste: t =
S
n
Distribucin del estadgrafo cuando la hiptesis nula es cierta: tn-1
Regin de aceptacin: {t / t ! t n "1,2# }*
Regin critica: {t / t > t n !1,2" }
Cuadro 4.8: Contraste para la media de una poblacin Normal con varianza desconocida.
H0 : = 12.5
Ha : ! 12.5
Nivel de significacin: 5% y 1%.
x ! 0 12.529 ! 12.5
= 0.338
= 0.316
Estadgrafo de contraste: Z =
S
14
n
Valores crticos : para el 5% t0.05= 1,96 para el 1% t0.01= 2,57
p-valor : 0,7571
Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de
aceptacin, por tanto aceptamos la hiptesis nula.
Conclusin no estadstica: La modificacin en el proceso de fabricacin no ha
modificado significativamente el grado alcohlico.
Cuadro 4.9: Aplicacin del contraste para la media de una poblacin Normal con varianza conocida al
problema de la modificacin en el grado alcohlico del vino de Ribera de Duero
tn-1,2 es el valor crtico de la t de Student tal que P( tn-1 > tn-1,2 ) = . Se ha denotado con el subndice
311
Hiptesis:
H0 : = 0
Ha : ! 0
Nivel de significacin:
x ! 0
Estadgrafo de contraste: Z =
S
n
Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0, 1)
Regin de aceptacin: {Z / Z ! z "/ 2 }
Regin critica: {Z / Z > z !/ 2 }
Cuadro 4.10: Contraste para la media de una poblacin Normal con varianza desconocida
cuando la muestra es grande.
312
(1 ! 2 = 0)
(1 ! 2 " 0)
para el contraste bilateral. Vemos como el contraste de que las medias son iguales es
equivalente al contraste de que la diferencia de medias vale 0.
Supongamos que los datos obtenidos son los siguientes para muestras aleatorias
313
de tamao
n1 = 14 y n2 = 6.
Ribera de Duero
12,8 12,8 12,5 11,9 12,5 12,1 12,2 12,6 13,0 12,4 12,6 12,2 12,8 13,0
Toro
13,0
14,0
13,2
13,4
13,2
13,9
Tabla 4.2: Grado alcohlico de 20 vinos de las denominaciones de origen de Ribera y Toro.
Una primera aproximacin a las diferencias entre los dos grupos sera la
construccin de grficos comparativos que muestren la estructura de los mismos, por
ejemplo, un Box-Plot con los grupos separados. (Ver figura 4.17).
Una simple inspeccin visual del grfico nos muestra que hay una clara diferencia
entre los grados de ambas denominaciones, a pesar de que la diferencia muestral es muy
evidente necesitamos un procedimiento ms formal para establecer si las diferencias
observadas pueden ser consideradas estadsticamente significativas. Construiremos el
procedimiento de contraste en varios supuestos comenzando desde el ms sencillo hasta
los ms complejos.
314
Figura 4.24: Box plot para la comparacin del grado alcohlico de las
denominaciones de Ribera y Toro.
"1
)
n1
x2 ! N(2 ,
"2
)
n2
#21 # 22
+
)
n1 n2
315
Z=
(x1 ! x2 ) ! (1 ! 2 )
"21 " 22
+
n1 n2
# N(0,1)
Z=
(x1 ! x2 )
"12 " 22
+
n1 n 2
# N(0,1)
H0 :1 = 2
Ha :1 " 2
(1 ! 2 = 0)
(1 ! 2 " 0)
Nivel de significacin:
(x1 ! x2 )
Estadgrafo de contraste: Z =
"12 " 22
+
n1 n 2
Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0, 1)
Regin de aceptacin: {Z / Z ! z "/ 2 }
Regin critica: {Z / Z > z !/ 2 }
Cuadro 4.11: Contraste para la diferencia de medias de dos poblaciones normales con varianza conocida.
Si aplicamos el contraste a los datos del ejemplo, obtenemos los resultados del
cuadro 4.12.
316
Hiptesis:
H0 :1 = 2
Ha :1 " 2
(1 ! 2 = 0)
(1 ! 2 " 0)
Z=
(x1 ! x2 ) ! (1 ! 2 )
# N(0,1)
1
1
"
+
n1 n 2
(n1 ! 1)S12
# $ 2n1 !1
2
"
(n 2 ! 1)S 22
# $ 2n 2 !1
2
"
317
t=
con S =
(x1 ! x 2 ) ! (1 ! 2 )
1
1
"
+
n1 n 2
(n1 ! 1)S 12 + (n2 ! 1)S 22
"2
n1 + n2 ! 2
(x1 ! x2 ) ! (1 ! 2 )
1
1
S
+
n1 n2
libertad.
Si la hiptesis nula es cierta, el estadgrafo de contraste que utilizaremos es
t=
(x1 ! x2 )
= t n1 +n 2 !2
S 1 + 1
n1 n 2
n1 S12
2
2 " # n1 $1
!
n2 S22
2
2 " # n 2 $1
!
t=
con S =
(x1 ! x2 )
= t n1 +n 2 !2
1
1
S
+
n1 n 2
n1 S 12 + n2 S 22
. Los dos estadsticos toman exactamente el mismo valor por lo
n1 + n2 ! 2
que pueden utilizarse indistintamente. Usaremos el calculado a partir de las cuasivarianzas porque son estimadores insesgados de la varianza poblacional.
*
318
t=
Estadgrafo de contraste: t =
1
1
1
1
S
+
S
+
n1 n 2
n1 n 2
Hiptesis:
con S =
El contraste se ha aplicado a los datos del ejemplo inicial y se han obtenido los
siguientes resultados (ver cuadro 4.14).
319
H0 :1 = 2 (1 ! 2 = 0)
Ha :1 " 2 (1 ! 2 " 0)
Nivel de significacin: = 0.05 (5%) 0.01 (1%)
(12.529 ! 13.450)
Estadgrafo de contraste: t =
= !5.256
1 1
0.359
+
14 6
Valores crticos : para el 5% t18,0.025= 2.101 para el 1% t18,0.005= 2.878
Hiptesis:
Hiptesis:
320
Hiptesis:
321
322
10
Antes
140
165
160
160
175
190
170
175
155
160
Despus
145
150
150
160
170
175
160
165
145
170
Reduccin
-5
15
10
15
10
10
10
-10
Como las variables estn relacionadas, todos los clculos que realizamos en el
caso de datos independientes ya no son vlidos. Para evitar este problema nos
centraremos en una sola variable aleatoria que es la diferencia entre los dos valores
obtenidos para cada uno de los individuos estudiados que mide el efecto del tratamiento
aplicado. Tenemos ahora una nueva variable D que suponemos que tiene una
distribucin Normal de media d desviacin tpica d . La hiptesis de inters es ahora
que, en promedio, el tratamiento aplicado a los individuos es 0, es decir, d = 0. El
contraste es ahora exactamente igual que el descrito para la media de una poblacin
Normal (ahora la poblacin de las diferencias.
323
Hiptesis:
H0 : d = 0
Ha :d ! 0
Nivel de significacin:
Estadgrafo de contraste: t =
Sd
n
Distribucin del estadgrafo cuando h0 es cierta: tn-1
Regin de aceptacin: {t / t ! t n "1,# }
Regin critica: {t / t > t n !1," }
Cuadro 4.17: Contraste para la diferencia de medias de dos poblaciones normales con datos apareados.
Hiptesis:
H0 : d = 0
Ha :d ! 0
Nivel de significacin: 5% y 1%
6
= 2.250
Estadgrafo de contraste: t = 8.433
10
Distribucin del estadgrafo cuando h0 es cierta: t9
Valores crticos : para el 5% t9, 0.05= 2,262 para el 1% t9, 0.01= 3,250
p-valor : 0,0510
Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de
aceptacin, por tanto aceptamos la hiptesis nula.
Conclusin no estadstica: Con los datos de los que disponemos no existe una
evidencia significativa de que exista una diferencia entre la presin sistlica antes y
despus de haber dejado de beber.
Cuadro 4.18: Contraste para la diferencia de medias de dos poblaciones normales con datos apareados
aplicado al ejemplo de la reduccin de la tensin arterial en alcohlicos.
324
325
Me1
x1
x2
Me2
326
327
HIPOTESIS:
H 0 : Me1 = Me 2
H a : Me1 " Me 2
(Me 1 ! Me 2 = 0)
(Me 1 ! Me 2 " 0)
n (n + 1)
U = min(U 1 , U 2 ) U i = n 1n 2 + i i
! Ri
2
n n
U! 1 2
2
n 1 n 2 (n 1 + n 2 + 1)
12
inf
{U / U!;n
,n
sup
1 2
REGION CRITICA:
{Z /
1 2
Z ! z " /2 }
{Z /
Z > z ! /2 }
HIPOTESIS:
H 0 : Me d = 0
H a : Me d ! 0
T = min(T+ , T! )
328
n(n + 1)
4
n(n + 1)(2n + 1)
24
T!
sup
inf
" T " T!;n }
{T / T!;n
sup
inf
REGION CRITICA: {T / T ![T";n ; T";n ]}
REG. DE ACEP.:
{Z /
Z ! z " /2 }
{Z /
Z > z ! /2 }
H0 :1 = = i = = r
i, j
H i,0 j / Hi,0 j
cierta ) = 1 ! "
329
P(Aceptar
H0 / H0
cierta ) = P( ! Aceptar
i!j
Hi,0 j / H0
cierta ) =
cierta ) = (1# $ )k
" P(Aceptar Hi,0 j / Hi,j
0
i!j
H0 /
H0 /
H0
H0
cierta ) =
45
poblaciones, aunque todas las medias fueran iguales tendramos una probabilidad del
90% de encontrar diferencias en alguna de las parejas.
Este problema es importante no solo en la comparacin de medias por parejas
sino tambin cuando se quieren realizar muchas comparaciones sobre el mismo
conjunto de datos. Supongamos, por ejemplo, que un investigador desea demostrar que
es capaz de encontrar diferencias entre personas convictas por algn tipo de delito y
personas que no. A tal fin realiza 100 medidas biomtricas como el permetro torcico,
el permetro craneal, etc.... que compara en los dos grupos. En cada comparacin tiene
una probabilidad del 5% de rechazar indebidamente, sin embargo (si las medidas fueran
independientes) tendra una probabilidad del 99,41% de encontrar diferencias en alguna
de las variables. El nmero esperado de contrastes significativos sera de 5.
330
Figura 4.26: Box plot para la comparacin del grado alcohlico de las
331
(n1 ! 1)
"12
(n1 ! 1)
F ==
(n 2 ! 1)S 22
" 22
(n2 ! 1)
S 21 " 22
= 2 2
S2 "1
libertad.
332
Hiptesis:
H0 :!12 = !22
Ha :!12 " ! 22
Nivel de significacin:
S 2
Estadgrafo de contraste: F = 12
S 2
Distribucin del estadgrafo cuando h0 es cierta: F n1 !1, n 2 !1
H0 :!12 = !22
Ha :!12 " ! 22
Nivel de significacin: = 5% y 1%
S12
Estadgrafo de contraste: F = 2 = 0.686
S
2
El valor F n !1,n !1, 1!" /2 es el valor crtico que deja a la derecha un rea de 1 ! " / 2 . En la
1
2
prctica puede calcularse como F n !1,n !1, 1!" /2 = 1 F n !1, n !1, " / 2
1
2
2
1
*
333
Quinta
Unidad Didctica
"TABLAS DE CONTINGENCIA"
334
5.1.1 Introduccin
La existencia de distintas pruebas estadsticas es consecuencia, en parte, de las
distintas escalas de medida que se utilizan para tratar las variables objeto de una
determinada investigacin.
Los investigadores de distintos campos utilizan de modo habitual variables
medidas en escala nominal y pasan buena parte de su tiempo clasificando y contando
individuos. As por ejemplo cualquier individuo puede ser clasificado en categoras
(varn, mujer; enfermo, sano; ausencia, presencia; soltero, casado, viudo, separado).
El resultado de tales clasificaciones da lugar a lo que en la terminologa
estadstica se le conoce como tablas de contingencia o tablas de frecuencias.
Tablas de contingencia son tablas de variables aleatorias cualitativas cuyos
datos estn recogidos en forma de tablas de frecuencias.
335
3) Test de asociacin:
Para comprobar si dos o mas caractersticas cualitativas estn relacionadas
entre s. (Ejemplo: Est la intencin de voto, a un determinado partido
poltico, relacionada con el sexo?).
En el desarrollo del captulo nos vamos a centrar en este ltimo tipo de contrastes.
EJEMPLO 5.1:
Supongamos una muestra de 100 individuos de una poblacin en los que estamos
estudiando el estado civil. Esta variable aleatoria puede tener cuatro categoras:
soltero, casado, viudo y divorciado. Supongamos que el nmero de individuos en
336
frecuencia
Observada
Solteros
Casados
Viudos
Divorciados
30
50
15
25
25
25
25
frecuencia
Esperada
esperadas discreparan poco y, seran muy diferentes en caso contrario. Se nos plantea
entonces un problema:
Cmo medir las discrepancias?. La forma ms simple de medir divergencias
entre ambas magnitudes sera efectuar la diferencia entre ambas (foi -fei ), en todas y
cada una de las casillas de la tabla y, obtener, de este modo, una magnitud que: si es
grande nos har pensar en rechazar la hiptesis de partida, y si es pequea en aceptarla.
En realidad el estadstico con el que vamos a trabajar se basa en esta idea, si bien tiene algunas
correcciones (no trabaja con diferencias sino con diferencias al cuadrado, para evitar problemas de signos,
y trabaja con discrepancias normalizadas, obtenindolas en valores relativos).
Estadgrafo de contraste:
!2 = #
i
(fo i " fe i )2
fei
337
338
EJEMPLO 5.2:
Supongamos cuatro tratamientos (Ai) que se piensa efectivos para curar una
determinada enfermedad, estos tratamientos se aplican a enfermos de dicha
enfermedad y se anota el tipo de respuesta que presentan (Bj). La respuesta se clasifica
en tres posibles clases: "peor", "igual", "mejor". Ejemplo tomado de MARTN
ANDRS, A. et al. (1995).
Peor
Igual
mejor
TOTAL
Trat 1
f11
28 f12
115 f13
150 f1.
Trat 2
15 f21
20 f22
85 f23
120 f2.
Trat 3
10 f31
30 f32
90 f33
130 f3.
Trat 4
f41
40 f42
115 f43
160 f4.
37 f .1
118 f.2
405 f.3
560 f..
TOTAL
339
En nuestro ejemplo:
Ho: El tipo de tratamiento no condiciona la respuesta del individuo.
Ha: Si condiciona.
(
)
( )
Ha:P( Ai ! Bj ) # P( Ai ) P( Bj ) en alguna ocasin
Ho:P Ai ! B j = P(A i ) P B j "i, j
fe 21 = f .. P(A2 )P(B1 )
p(A2 ) =
120 f 2.
=
560 f..
p(B1 ) =
37 f.1
=
560 f ..
340
f f.
f f
fe 21 = f .. P (A2 ) P (B1 ) = f .. 2. 1 = 2. .1 = 7.93
f.. f ..
f ..
Trat 1
Trat 2
Trat 3
Trat 4
TOTAL
Peor
7
9.91
15
7.93
10
8.59
5
10.57
37
Igual
28
31.61
20
25.28
30
27.39
40
33.72
118
mejor
115
108.48
85
86.79
90
94.02
115
115.71
405
TOTAL
150
120
130
160
560
! 2exp =
##
i
fe ij
(7 " 9.91)2
9. 91
+... +
= 13.87
341
2
! exp
""o# ! $2 , %
342
"TABLAS DE CONTINGENCIA"
5.2 Ampliacin
343
344
345
(fo i ! fe i )2
fe i
Tabla de contribuciones
Peor
0.85
6.31
0.23
2.94
Trat 1
Trat 2
Trat 3
Trat 4
Igual
0.41
1.11
0.25
1.17
mejor
0.39
0.04
0.17
0.00
TOTAL
1.65
7.46
0.65
4.11
13.87
(7 ! 9.91) 2
9.91
= 0.85
(28 ! 31.61)2
31.61
= 0.41 etc.
T1
PEOR
7
IGUAL
28
MEJOR
115
TOTAL
150
346
T3
T4
TOTAL
10
5
22
30
40
98
90
115
320
130
160
440
2
! exp = 5. 04 que hemos de comparar con el correspondiente valor crtico de la
tabla en este caso con 4 grados de libertad, que result ser en este caso
2
! 4;0.05 = 9.488
Para llevar a cabo el segundo de los contrastes, que nos ponga de manifiesto que
es el tratamiento 2 el que difiere del resto necesitamos construir otra subtabla en la que
se disponga de la informacin que nos interesa, es decir el tratamiento 2 y el tratamiento
(1+3+4).
347
PEOR
15
22
37
T2
T(1+3+4)
Total
IGUAL
20
98
118
MEJOR
85
320
405
Total
120
440
560
Variacin
g.l.
! 2exp.
significacin
5.04
No
9.48
**
14.52
13.87
**
tratamientos
1,3,4
tratamientos
2 y (1+3+4)
Sumas
tratamientos
1,2,3,4
Con esta descomposicin hemos probado que el tratamiento 2 difiere del resto
como pareca intuirse de la tabla de contribuciones, pero esta afirmacin, aunque vlida
no deja de ser incompleta ya que nada nos dice de en qu sentido es diferente, dicho de
otra forma, difiere el tratamiento 2 del resto porque es peor o porque es mejor. Faltara,
348
pues, descomponer la ltima tabla que nos dio significativa, y que tena dos grados
de libertad, en otras dos subtablas de 1 grado de libertad cada una para saber el sentido
de las diferencias.
Un esquema global de los pasos pueden verse en la figura 5.1.
P
T1
P
T1
T3
T4
T2
T3
T4
NS
T2
NS
T1+T2+T3
T2
(I+M)
T1+T2+T3
T2
*
T1+T2+T3
349
MEJORAN
NO MEJORAN
NUEVO TRATAMIENTO
20
20
TRAT. ESTNDAR
24
16
MEJORAN
NO MEJORAN
NUEVO TRATAM
12
18
TRAT. ESTNDAR
SOLO MUJERES
MEJORAN
NO MEJORAN
NUEVO TRATAM
TRAT. ESTNDAR
21
350
351
ocurrir la paradoja cuando se desagrega para hombres y mujeres, siempre es posible que
exista alguna otra variable, como la edad de los individuos o la intensidad y grado de
avance de la enfermedad, con respecto a la cual la desagregacin podra conducir a una
conclusin directamente opuesta a la indicada por la tabla agregada.