Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Contraste de Hipótesis
Contraste de Hipótesis
!" #
'
&
'
2))
$ %&
$
) !
&
( $$ +%
&
*
$
!" "
!
," ( $" $
(
"
&
+
%
. / $$
& ,-,
$
% # ,"
0 #
$
!
0 1
"
2
3(
. 4
$ 4
$
"
"
( $" $
.
# !/
"
.
"
"$
%
$ (
.$ 2 .
3
!* .
5
.
(
.$ 2 6 3 *7 . 5 "4 +% # ," 8
.
.
9
$
$ ,"
7 6 8 $
"
% $ ,"
$
%
$
!"
.
7 .
# "4
< $
8
," $
;" =
$
$
(
.$
$>
"
"
," ( $
% $
!
0
$ ;
+
0
>
* >+ &
4
A #
" B #
0 1 C
$
$=
! !
9$
.$
,"
!.
"
(
$
+% $ !" $ ," $
$
.$ :7 # ;
$
7 "
%
! > $ ( *>>+ ?
@
( " $=
$
! !
*#
1) Introduccin
Vamos a trabajar con el ejemplo de un estudio de obesidad e hipertensin. En esta base de
datos, la variable obesidad es categrica (obeso / no obeso) y querramos saber si est
relacionada con el sexo (otra variable categrica con dos posibles valores, hombre / mujer);
esto es, responder a la pregunta hay diferente proporcin de obesos entre hombres y
mujeres?
La tabla de datos: "PRESION ARTERIAL Y OBESIDAD.xls", est disponible en el aula
virtual de fabis y se muestra en el Anexo I de este documento. Se trata de un pequeo
estudio transversal (n = 50) en el que se han recogido cinco variables:
!" #
$ %&
"
.; .
$=
D
0
# 0
D"
1 *+
7 -
.$
7@ "
!-
A #
#
*E +
; .
!%
Tablas de contingencia
Resumen del procesamiento de los casos
N
GENERO * PRESENCIA
DE OBESIDAD
Vlidos
Porcentaje
50
Casos
Perdidos
N
Porcentaje
100,0%
,0%
Total
Porcentaje
50
100,0%
Esta primera tabla explica el total de casos analizados y si hubo casos perdidos (individuos
que no tuvieran un valor recogido en alguna de las dos variables analizadas en el contraste).
Luego aparece la tabla de contingencia, que en este caso concreto es una tabla 2x2. Si
previamente habamos sealado la casilla correspondiente (filas) en la pestaa "Casillas..."
se nos mostrarn los recuentos en cada celda y sus porcentajes respecto a la fila:
Tabla de contingencia GENERO * PRESENCIA DE OBESIDAD
PRESENCIA DE
OBESIDAD
obeso
GENERO
hombre
Recuento
mujer
% de
GENERO
Recuento
Total
% de
GENERO
Recuento
% de
GENERO
Total
no obeso
22
28
78,6%
21,4%
100,0%
11
11
22
50,0%
50,0%
100,0%
33
17
50
66,0%
34,0%
100,0%
E inmediatamente aparece la ventana con el contraste Chi cuadrado. SPSS realiza la Chi
cuadrado y aporta tambin la correccin por continuidad (correccin de Yates), la razn de
verosimilitud, el test exacto de Fisher y otro contraste que se llama Asociacin Lineal por
Lineal.
Pruebas de chi-cuadrado
Valor
Chi-cuadrado de Pearson
Sig. asinttica
(bilateral)
gl
1
3,299
,069
Razn de verosimilitud
4,509
,034
N de casos vlidos
4,392
Sig. exacta
(unilateral)
,042
,035
,034
4,482(b)
Sig. exacta
(bilateral)
,036
50
Por ltimo, el programa SPSS -si se lo hemos indicado marcando Riesgo- nos hace una
evaluacin de la fuerza que asocia (o no) a ambas variables, calculando OR y RR. En la
siguiente salida vemos que la OR que ha calculado es 3,667 (hombre/mujer), que se lee: "los
hombres tienen un riesgo 3,7 veces el de las mujeres para tener obesidad".
!" #
$ %&
"
.; .
Hombre
Mujer
Obeso
22
11
No obeso
6
11
Tambin nos aporta el IC95% para la OR, que se sita entre 1,072 y 12,547. Con ello
sabemos dos cosas: primero que el contraste de hiptesis debe ser significativo, esto es,
que se rechazar la hiptesis nula de la "no-asociacin entre las dos variables", ya que la
OR no contiene el valor 1 (el riesgo de obesidad sera el mismo entre hombres y mujeres, y
por tanto no habra relacin entre gnero y obesidad); segundo que el intervalo de confianza
es muy ancho y, por tanto, la estimacin que hacemos de la verdadera OR (en la poblacin)
muy imprecisa, llegando a concluir que el riesgo de obesidad es superior en hombres que en
mujeres, pero con un rango de incremento del riesgo que podra ir desde el 7% al 1.155%, o
lo que es lo mismo, que el riesgo de obesidad en hombres es entre 1,07 y 12,5 veces el de
las mujeres.
Estimacin de riesgo
Intervalo de confianza al 95%
Valor
Inferior
Superior
3,667
1,072
12,547
1,571
,992
2,490
,429
,188
,976
N de casos vlidos
50
Por ltimo podemos ver el grfico de barras agrupadas para cada categora de la variable
dependiente (en nuestro caso obesidad). A simple vista se aprecia la mayor proporcin de
obesos entre los hombres.
Grfico de barras
PR ESENC IA DE
OBESIDAD
25
obeso
no obeso
Recuento
20
15
10
0
hombre
mujer
G ENE RO
$=
D
0
# 0
D"
1 *+
7 -
0
(
.$
7@ "
!-
A #
#
*E +
; .
!%
Y ya en EPITABLE se activa la opcin Describe > Proportion > Simple random sampling.
!" #
$ %&
"
.; .
Total Observations (denominador): total de individuos del grupo evaluado (en nuestro caso
28 hombres)
As, la proporcin (Proportion) de obesos entre los hombres es de 22 / 28 = 78,57%.
Vemos como para esta estimacin puntual (78,57%) el programa EPIINFO calcula unos
intervalos de confianza (95% CI), por tres mtodos. El ms adecuado para muestras
pequeas es el mtodo exacto por la distribucin binomial (Exact binomial 95% CI), que en
este caso da un valor entre 59,05% y 91,7%.
Ahora debe hacerse lo mismo en el grupo de mujeres. Abandonas (Quit) y vuelves a entrar,
para calcular la proporcin de obesidad entre las mujeres, que es de 11 / 22 = 50%
Vemos que EPI-INFO calcula un IC95% para esta proporcin que va de 28,22% a 71,78%.
Estos dos intervalos de confianza son muy grandes, por los pocos casos que hay en la
muestra analizada, y se superponen en un pequeo rango de valores (el que va desde
$=
D
0
# 0
D"
1 *+
7 -
0
(
.$
7@ "
!-
A #
#
*E +
; .
!%
59,05% a 71,78%), siendo muy difcil tomar una decisin con estos datos. La estimacin de
la proporcin verdadera de obesidad en la poblacin de la que procede nuestra muestra es
muy imprecisa, por lo que aun siendo la estimacin puntual muy diferente en el grupo de
hombres y de mujeres (78,6% versus 50%) no es posible asegurar con un bajo error a
equivocarse de que dicha diferencia no se deba al azar.
Y una vez dentro, debes seleccionar 2 en la pregunta How many samples?, ya que
queremos comparar proporciones en dos grupos, los establecidos por la variable dicotmica
sexo. En el siguiente cuadro de dilogo debes introducir los porcentajes puntuales de
obesos en cada muestra (muestra 1 = hombres; muestra 2 = mujeres), y el nmero total de
observaciones en cada una de ellas. EPI-INFO calcula el test Chi cuadrado correspondiente,
que, como puedes comprobar, arroja idntico resultado al obtenido con SPSS en la tabla de
contingencia.
!" #
$ %&
"
.; .
En esta calculadora hemos de introducir nosotros directamente los valores de cada celdilla
de la tabla de contingencia, dndole a la tecla <enter> para pasar a la celdilla siguiente, y
finalmente a la tecla de funcin <F4> para calcular. Nos va a proporcionar tanto las medidas
de asociacin (Odds ratio y Riesgo relativo) como sus intervalos de confianza (Lmites de
Confianza), as como el test de hiptesis Chi cuadrado (Valor-Chi y Valor-P), con sus
correspondientes correcciones (de Mantel-Haenszel y de Yates).
$=
D
0
# 0
D"
1 *+
7 -
0
(
.$
7@ "
!-
A #
#
*E +
; .
!%
Enseguida se nos abre una pantalla que se titula Tablas de contingencia: Tablas 2x2
simples, donde debemos cumplimentar una serie de apartados:
Tipo de estudio ante el que estamos. En nuestro ejemplo seleccionamos Transversal.
!" #
$ %&
"
.; .
Para que el programa realice los clculos tenemos que recurrir al botn que simula una
pequea calculadora de bolsillo en la barra de herramientas superior, y que ahora aparecer
resaltada. Al pulsar sobre ella se abre la ventana de resultados, obtenindose el siguiente
listado de texto:
$=
D
0
# 0
D"
1 *+
7 -
0
(
.$
7@ "
!-
A #
#
*E +
; .
!%
Enfermos
-------22
11
-------33
Sanos
-------6
11
-------17
Total
-------28
22
-------50
Prevalencia de la enfermedad
Estimacin
---------------------------------------- ---------En expuestos
0,785714
En no expuestos
0,500000
Razn de prevalencias
1,571429
---------------------------------------- ----------
IC(95,0%)
----------------0,991555
2,490418
-----------------
Prevalencia de exposicin
Estimacin
---------------------------------------- ---------En enfermos
0,666667
En no enfermos
0,352941
Razn de prevalencias
1,888889
---------------------------------------- ----------
IC(95,0%)
----------------0,949915
3,756020
-----------------
OR
--------3,666667
IC(95,0%)
----------------1,071564
12,546558
1,097069
12,220558
(Woolf)
(Cornfield)
Valor p
--------0,0343
0,0693
!" #
$ %&
"
ANEXO I
Tabla de datos Bajo peso al nacer.xls
.; .