Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Dot. Nm 0702004
Resumen
Cuando queremos evaluar el grado de asociacin o independencia entre una variable cuantitativa y
una variable categrica (y recurdese que sta clasifica o diferencia a los individuos en grupos, tantos
como categoras tiene dicha variable), el procedimiento estadstico inferencial recurre a comparar las
medias de la distribuciones de la variable cuantitativa en los diferentes grupos establecidos por la
variable categrica. Si sta tiene solo dos categoras (es dicotmica), la comparacin de medias entre
dos grupos independientes se lleva a cabo por el test t de Student; si tiene tres o ms categoras, la
comparacin de medias entre tres o ms grupos independientes se realiza a travs de un modelo
matemtico ms general, el Anlisis de la Varianza (ANOVA). En ambos casos, las pruebas
estadsticas son exigentes con ciertos requisitos previos: la distribucin Normal de la variable
cuantitativa en los grupos que se comparan y la homogeneidad de varianzas en las poblaciones de
las que proceden los grupos; su no cumplimiento conlleva la necesidad de recurrir a pruebas
estadsticas no paramtricas. En este documento se ensea a hacer estos anlisis con el programa
SPSS para Windows, y alternativamente con los programas EPIINFO 6.0 y su versin 3.3.2
(actualizada en 2005) y con el programa EPIDAT 3.1.
0. INTRODUCCIN TERICA.
Cuando tengamos que evaluar la asociacin entre una variable categrica (o nominal) y una
variable cuantitativa, el procedimiento es analizar y comparar las medias de la distribucin de
la variable cuantitativa en cada uno de los grupos que conforma la variable categrica.
Si la variable cualitativa slo tiene dos categoras (por ejemplo la variable sexo) el
procedimiento se reduce a comparar las medias de la variable cuantitativa en esos dos
grupos (hombres y mujeres en el ejemplo). El contraste de hiptesis es la t de Student, para
comparar las medias (de la variable contnua) en dos grupos independientes, que en SPSS
est en:
Analizar > Comparar medias > Prueba t para dos muestras independientes
Si la variable categrica tiene tres o ms categoras (por ejemplo la variable raza con las
siguientes mediciones: blanca, negra, otras) el procedimiento tambin consiste en comparar
las medias de la variable cuantitativa en cada uno de los grupos que conforma cada estrato
o categora de la variable nominal, pero el procedimiento ya no es la t de Student sino un
modelo matemtico ms amplio: el Anlisis de la Varianza (ANOVA de una va), que va a
permitir no slo saber si hay diferencias en las medias en los diferentes grupos sino explorar
Correspondencia: marianoaguayo@telefonica.net
1 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
entre qu grupos concretos estn o no esas diferencias (a travs de los llamados contrastes
a posteriori). El anlisis en SPSS est en:
a) La variable cuantitativa debe distribuirse segn la Ley Normal en cada uno de los
grupos que se comparan (CRITERIO DE NORMALIDAD).
Con respecto al segundo requisito para aplicar estos contrastes (ANOVA y t de Student), es
menos exigente, y existen alternativas para hacer el contraste. As veremos que en SPSS
hay una lectura de la prueba asumiendo varianzas desiguales.
Vamos a trabajar con el ejemplo del estudio de obesidad e hipertensin. En esta base de
datos, la variable obesidad es categrica (obeso / no obeso) y desearamos saber si est
relacionada con la edad de los individuos (una variable cuantitativa, cuya medida son los
aos cumplidos), esto es, responder a la pregunta hay diferencias en la edad de los
individuos segn sean o no obesos? O de forma alternativa, est relacionada la edad con
la presencia de obesidad?
1
Debe recordarse aqu tambin que en determinados casos en que una variable cuantitativa no sigue
una Ley Normal puede transformarse mediante una operacin matemtica (por ejemplo una
transformacin logartmica), consiguiendo entonces que su transformada s cumpla el criterio de
normalidad. Merece la pena probar antes de optar por una prueba no paramtrica.
DocuWeb fabis.org 2 de 20
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin fabis.org, 2007
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
En la pestaa de Grficos
elegimos la opcin Grficos con
pruebas de normalidad. Vemos
que esta ventana de Explorar >
Grficos tambin es posible obtener:
Explorar
PRESENCIA DE OBESIDAD
Primero se muestra un resumen de los casos (individuos) que se van a explorar o procesar.
Resumen del procesamiento de los casos
Casos
PRESENCIA Vlidos Perdidos Total
DE OBESIDAD N Porcentaje N Porcentaje N Porcentaje
EDAD EN AOS obeso 33 100,0% 0 ,0% 33 100,0%
CUMPLIDOS no obeso 17 100,0% 0 ,0% 17 100,0%
Luego un cuadro resumen con la estadstica descriptiva de la variable cuantitativa (el dependiente
para el programa SPSS) en cada uno de los grupos establecidos por las diferentes categoras e la
variable cualitativa (el factor para el programa SPSS).
En esta salida podemos ver un aspecto muy interesante: los IC95% para la media en cada grupo, una
forma alternativa al contraste de hiptesis clsico para tomar decisiones sobre la relacin entre
variables
DocuWeb fabis.org 3 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Descriptivos
PRESENCIA Estadstico Error tp.
EDAD EN AOS DE OBESIDAD
obeso Media 48,70 0,90
CUMPLIDOS Intervalo de confianza Lmite inferior 46,84 9
para la media al 95% Lmite superior
50,55
.
En nuestro ejercicio vemos que, tanto la estimacin puntual de la media de la variable edad en
ambos grupos (48,70 vs 50,24) como sus intervalos de confianza (46,84 50,55 en el grupo obeso
vs 47,89 52,78 en el grupo no obeso) son muy superponibles, por lo que es altamente
improbable que las variables edad y obesidad estn relacionadas en la poblacin (lo que conllevara a
que las edades medias en ambos grupos fueran muy diferentes).
Seguidamente, se nos muestra las pruebas de normalidad que lleva a cabo el programa SPSS. Nos
hemos de fijar en la significacin estadstica de estos dos contrastes, asumiendo la normalidad de la
distribucin si en ambos grupos el nivel de p es no significativo (esto es, p>0,05). En nuestro
ejemplo podemos asumir la normalidad de la variable cuantitativa edad en ambos grupos (obesos /
no obesos).
Pruebas de normalidad
a
PRESENCIA Kolmogorov-Smirnov Shapiro-Wilk
DE OBESIDAD Estadstico gl Sig. Estadstico gl Sig.
EDAD EN AOS obeso ,124 33 ,200* ,951 33 ,142
CUMPLIDOS no obeso ,145 17 ,200* ,950 17 ,450
*. Este es un lmite inferior de la significacin verdadera.
a. Correccin de la significacin de Lilliefors
obeso
0
Frequency Stem & Leaf
3,00 4 . 111
-1
5,00 4 . 22333
-2
40 45 50 55 60
Valor observado
DocuWeb fabis.org 4 de 20
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin fabis.org, 2007
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
4,00 4 . 4555
2,00 4 . 77
60
3,00 4 . 899
4,00 5 . 0001
6,00 5 . 222333
3,00 5 . 445
2,00 5 . 77
55
Stem width: 10
Each leaf: 1 case(s)
50
2,00 4 . 22
7,00 4 . 7778889
5,00 5 . 02344
3,00 5 . 779 40
0
Como puede verse en nuestro ejemplo, las edades
medias en el grupo no obeso son ligeramente
mayores que en el grupo obeso, pero las
-1 medianas son idnticas y un amplio porcentaje de
individuos (los situados dentro de cada caja, el 50%
de cada muestra) tienen unas edades muy
40 45 50 55 60 parecidas.
Valor observado
Con lo ya visto hasta ahora tenemos una
aproximacin inferencial sin necesidad de recurrir al contraste. Tanto el anlisis de los
intervalos de confianza de las medias como el estudio de los grficos de caja nos permiten
una evaluacin de hasta qu punto pueden estas dos variables estar relacionadas en la
poblacin de la que proviene la muestra. Es muy probable que no estn asociadas. Pero
para completar el anlisis inferencial debemos recurrir al contraste de hiptesis.
H0 1 = 2
DocuWeb fabis.org 5 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Prueba T
Estadsticos de grupo
Primero se muestran los estadsticos resumen en cada grupo: N (tamao), media, desviacin tpica y
el error estndar de la media.
Luego el programa SPSS nos aporta informacin de la prueba T en un nico cuadro resumen, donde
se nos ofrecen varias cosas, que no debemos confundir:
Una prueba de homogeneidad de varianzas (la prueba de Levene), que nos va a informar
sobre el segundo requisito para aplicar la comparacin de medias mediante la prueba t de
Student: la homogeneidad de varianzas. El programa hace un contraste a travs del
estadstico F de Snedecor y nos aporta una significacin estadstica, o valor p asociado a la
hiptesis nula de que las varianzas son homogneas (sealado en color naranja en el
siguiente cuadro). Cuando ese valor p es significativo (p<0,05) debemos dudar de la
homogeneidad de varianzas.
Una doble salida de la comparacin de medias en los dos grupos, expresada en dos
filas de la ventana:
o en la fila superior la salida es cuando se han asumido varianzas iguales en el
2
Vemos como tambin es posible agrupar por una variable cuantitativa estableciendo un punto de
corte, lo que la transformara de facto en una variable categrica con dos niveles o estratos.
DocuWeb fabis.org 6 de 20
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin fabis.org, 2007
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
Prueba de Levene
para la igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
Diferencia Error tp. de diferencia
F Sig. t gl Sig. (bilateral) de medias la diferencia Inferior Superior
EDAD EN AOS Se han asumido
,273 ,604 -1,004 48 ,320 -1,538 1,532 -4,619 1,542
CUMPLIDOS varianzas iguales
No se han asumido
-1,022 34,059 ,314 -1,538 1,505 -4,596 1,520
varianzas iguales
Por otra parte, si interpretamos la diferencia de medias de edad entre ambos grupos, sta se
situara en la poblacin, con una elevada confianza, entre -4,619 y +1,542 aos. Es una
estimacin algo imprecisa (unos cinco aos arriba o abajo) y contiene el valor cero, que
nos hace llegar a la misma conclusin: por la variabilidad del muestreo (error aleatorio) es
posible explicar las pequeas diferencias de medias de edad (1,53 aos) encontradas en
nuestro estudio, por lo que debemos asumir la no-diferencia de medias de edad en la
poblacin.
3. Vamos a ver ahora cmo proceder cuando no es posible aplicar una prueba t de
Student, empleando entonces una prueba no paramtrica.
DocuWeb fabis.org 7 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Como en el ejercicio anterior, lo primero es comprobar si se dan los requisitos para aplicar
las pruebas paramtricas, basadas en la media y la varianza. Esto es, hay que explorar
cmo es la distribucin de la variable TAS en cada grupo determinado por la variable
obesidad, solicitando pruebas de normalidad que nos permitan tomar una decisin.
Explorar
PRESENCIA DE OBESIDAD
Resumen del procesamiento de los casos
Casos
PRESENCIA Vlidos Perdidos Total
DE OBESIDAD N Porcentaje N Porcentaje N Porcentaje
PRESIN ARTERIAL obeso 33 100,0% 0 ,0% 33 100,0%
SISTLICA no obeso 17 100,0% 0 ,0% 17 100,0%
Como podemos ver en el cuadro resumen de estadsticos, la media de TAS en los dos grupos de
comparacin (obesos / no obesos) es ms elevada en el grupo de no obesos (144,95 con un IC95%
entre 131,15 y 158,73) que en el grupo de obesos (125,97 con un IC95% entre 119,47 y 132,47). La
diferencia puntual de estas medias es:
El programa nos muestra ahora las pruebas de normalidad, para tomar una decisin sobre la
adecuacin de los test paramtricos a la comparacin de medias.
DocuWeb fabis.org 8 de 20
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin fabis.org, 2007
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
Pruebas de normalidad
a
PRESENCIA Kolmogorov-Smirnov Shapiro-Wilk
DE OBESIDAD Estadstico gl Sig. Estadstico gl Sig.
PRESIN ARTERIAL obeso ,203 33 ,001 ,930 33 ,036
SISTLICA no obeso ,163 17 ,200* ,958 17 ,587
*. Este es un lmite inferior de la significacin verdadera.
a. Correccin de la significacin de Lilliefors
Ambas pruebas de normalidad muestran que en el grupo obeso la variable TAS no se distribuye
segn una Ley Normal, ya que la p asociada a los contrastes de K-S (0,001) y S-W (0,036) da por
debajo del nivel de significacin alfa prefijado (0,05). Esto nos obligar a tomar un camino diferente en
el anlisis de la relacin entre estas dos variables, optando por pruebas no paramtricas.
120
Llegados a este punto, si deseamos hacer un
contraste de hiptesis para evaluar hasta qu punto
100 las medias de TAS son diferentes, debemos optar
por una de las Pruebas no paramtricas > (para)
80
2 muestras independientes, con el casi
obeso no obeso
PRE SE NC IA DE OB ESIDA D convencimiento de que el test va a ser
estadsticamente significativo.
Pruebas no paramtricas
Estadsticos descriptivos
Desviacin
N Media tpica Mnimo Mximo
PRESIN ARTERIAL
50 132,42 23,168 95 190
SISTLICA
PRESENCIA DE
50 1,34 ,479 1 2
OBESIDAD
DocuWeb fabis.org 9 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Prueba de Mann-Whitney
Rangos
Estadsticos de contrastea
PRESIN
ARTERIAL
SISTLICA
U de Mann-Whitney 166,500
W de Wilcoxon 727,500
Z -2,358
Sig. asintt. (bilateral) ,018
a. Variable de agrupacin: PRESENCIA DE OBESIDAD
Tras hacer un pequeo resumen de los casos procesados a travs de sus estadsticos descriptivos
(tamao muestral, media, desviacin tpica y valores mximo y mnimo), el programa procesa la
informacin contenida en la variable cuantitativa en cada grupo, y calcula varios estadsticos de
contraste. Lo que debemos interpretar es la Sig. Asinttica (bilateral), que en nuestro caso vale
0,018 y lleva a concluir que se rechaza la hiptesis nula de que la media de TAS es similar en ambos
grupos; o lo que es alternativamente igual, que existe una asociacin estadsticamente significativa
entre la TAS y la Obesidad).
H0 1 = 2 = 3 = n
Esto es, con que exista una media diferente a las dems, el test estadstico ser significativo
al nivel alfa establecido.
El ANOVA tiene las mismas exigencias que la t de Student: requiere que la variable
cuantitativa se distribuya segn una Ley Normal en cada uno de los grupos a comparar, y
adems exige que las varianzas sean homogneas.
Vamos a realizar una prueba de ANOVA, para lo cual vamos a convertir la variable cuantitativa edad
de la base de datos OBESIDAD Y HTA en una variable categrica (edadrec) con tres categoras:
a) menos de 47 aos
b) de 47 a 52 aos
c) ms de 52 aos
Y ahora desearamos comprobar si existe relacin entre la presin arterial sistlica (TAS) y los tres
segmentos de edad establecidos por edadrec. Consistira en evaluar si las medias de TAS son
diferentes en los grupos de edad, y si fuese as en qu sentido y en qu estratos etarios.
DocuWeb fabis.org 10 de 20
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin fabis.org, 2007
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
Cases
EDAD EN AOS Valid Missing Total
CUMPLIDOS (Banded) N Percent N Percent N Percent
PRESIN ARTERIAL Menos de 47 aos 19 100,0% 0 ,0% 19 100,0%
SISTLICA De 47 a 52 aos 16 100,0% 0 ,0% 16 100,0%
Ms de 52 aos 15 100,0% 0 ,0% 15 100,0%
Tests of Normality
a
EDAD EN AOS Kolmogorov-Smirnov Shapiro-Wilk
CUMPLIDOS (Banded) Statistic df Sig. Statistic df Sig.
PRESIN ARTERIAL Menos de 47 aos ,278 19 ,000 ,823 19 ,002
SISTLICA De 47 a 52 aos ,193 16 ,112 ,850 16 ,013
Ms de 52 aos ,117 15 ,200* ,953 15 ,574
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
160
120
100
80
DocuWeb fabis.org 11 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Con los datos previos ya intumos que no van a encontrarse diferencias estadsticamente
significativas entre las medias de TAS al comparar los tres grupos de edad.
Por otra parte no sera demasiado correcto aplicar un ANOVA, ya que la variable
TAS no se distribuye como una Normal en los grupos de comparacin. De todas
formas, y con carcter puramente instructivo, vamos llevar a cabo el contraste.
Tambin debemos explorar los contenidos de la pestaa Opciones..., para solicitar una
prueba de homogeneidad de varianzas y, si lo deseamos, un resumen de los principales
descriptivos en cada grupo de comparacin.
DocuWeb fabis.org 12 de 20
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin fabis.org, 2007
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
ANOVA de un factor
Primero se nos muestra un cuadro resumen con los estadsticos descriptivos (de la variable
cuantitativa) ms relevantes en cada grupo que se va a contrastar: las medias (y sus IC95%), las
desviaciones tpicas y los valores mximo y mnimo.
Descriptivos
Luego, el programa SPSS nos ofrece un test para evaluar la homogeneidad de varianzas: es el mismo
que se aplicaba de rutina en el procedimiento comparacin de medias en dos grupos independientes
(prueba T): el test de Levene. En nuestro ejemplo la significacin estadstica p vale 0.056, pudiendo
asumirse la homogeneidad de varianzas (aunque en el lmite de la no significacin).
Por ltimo, aparece la salida del ANOVA propiamente dicho, con sus diferentes componentes o
fuentes de variabilidad: la inter-grupos y la intra-grupos. Esta ltima representara la variabilidad o
dispersin que no es explicada por el factor de agrupamiento (la variable categrica), y que sera
explicable slo por el azar.
ANOVA
Para llevar a cabo el contraste, se recurre al estadstico F de Snedecor, que en nuestro ejemplo vale
0.416 y tiene un valor p asociado de 0.662 (no significativo). Con esto concluiramos nuestra
evaluacin, diciendo que las variables TAS y grupos de edad no muestran asociacin; o que se
acepta la hiptesis nula de que las medias de TAS son iguales en los diferentes grupos de
edad. En este caso no habra lugar a evaluar los contrastes a posteriori, puesto que no se han
encontrado diferencias significativas en el ANOVA. An as mostramos la salida de SPSS:
DocuWeb fabis.org 13 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
En el cuadro de comparaciones mltiples vemos que cada grupo de edad se compara con los otros
dos, obtenindose en cada contraste la diferencia de medias, el IC95%, el error estndar y el
valorpasociado, que en todos los casos es no-significativo, como ya sabamos que iba a suceder.
La salida que obtendremos, tras dar al botn de aceptar, ser la siguiente (nos hemos
pasado ahora a la versin en ingls del programa SPSS 13.0):
Luego aparece la prueba de contraste, el test de Kruskal-Wallis, con los tamaos de muestra (N) y los
rangos promedio para cada uno de los grupos a comparar. Y despus, en una segunda tabla, aparece
el estadstico Chi-cuadrado, que vale 0,487, sus grados de libertad (el nmero de grupos -3- menos
uno), y su significacin estadstica (p = 0,784). Llegamos a la misma conclusin que con el ANOVA:
DocuWeb fabis.org 14 de 20
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin fabis.org, 2007
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
Ranks
EDAD EN AOS N Mean Rank
PRESIN ARTERIAL CUMPLIDOS
Menos (Banded)
de 47 aos 19 23,71
SISTLICA De 47 a 52 aos 16 26,28
Ms de 52 aos 15 26,93
Total 50
a,b
Test Statistics
PRESIN
En este ejemplo slo puede concluirse que no tenemos
ARTERIAL pruebas para rechazar la hiptesis nula, esto es
Chi-Square
SISTLICA
,487
aceptaremos la igualdad de medias en la poblacin de la
df 2 que proviene la muestra y concluiremos diciendo que
Asymp. Sig. ,784 no se han encontrado argumentos que relacionen la
a. Kruskal Wallis Test TAS con los tres rangos de edad analizados. Por otra
b. Grouping Variable: EDAD EN
parte, si hubisemos detectado diferencias hemos de
AOS CUMPLIDOS (Banded)
aclarar que con este tipo de contrastes no paramtricos
no es posible realizar contrastes a posteriori.
Vamos a trabajar con el mismo ejemplo que en el apartado 1 paso 3, esto es, vamos a
comparar las medias de TAS entre los dos grupos establecidos por la variable Obesidad
(obesos / no obesos). Pero en este caso ya tenemos calculados sus ndices resumen: la
media, la varianza y el tamao muestral.
Existe asociacin? Presin arterial sistlica
Obesidad N Media Varianza Desv. Estndar
Obeso 33 125,97 336,030 18,331
No obeso 17 144,94 719,434 26,822
DocuWeb fabis.org 15 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Y ahora debemos introducir los datos que nos pide la calculadora: la media, la desviacin
estndar y el tamao de la muestra, para cada grupo (obesos y no obesos). Mostramos a
continuacin la salida para el grupo obesos:
El intervalo de confianza al 95% que nos da el programa EPI INFO (119,72 132,22) es ligeramente
ms pequeo que el que aportaba el programa SPSS para la misma media (119,47 132,47). De
forma similar se hara el clculo en el otro grupo (no obesos), y con ambos intervalos de confianza
deberamos tomar la decisin de hasta qu punto ambas medias en la poblacin seran diferentes.
1.2. En segundo lugar, procedamos a comparar las medias de TAS en los dos
grupos. Esta es la aproximacin inferencial ms clsica, a travs del contraste
de hiptesis. En la calculadora estadstica EPITABLE se realiza a travs de la
opcin Compare > Means
Una vez abierta la ventana de dilogo, nos pide cuantas muestras o grupos vamos a
comparar (how many samples?). En nuestro ejemplo son solo dos (obesos y no
obesos), por lo que sealamos 2 y aceptamos. El programa nos ofrece una nueva ventana
DocuWeb fabis.org 16 de 20
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin fabis.org, 2007
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
para hacer un ANOVA para dos grupos, debiendo introducir para cada uno de los grupos la
media, la varianza y el tamao.
Al aceptar (Calculate) el programa nos ofrece la salida de un Anlisis de la Varianza (ANOVA), con la
variabilidad intergrupos (Variance between samples), la varianza residual (Residual variance), el
estadstico de contraste de Snedecor (F Statistic) y el valor p asociado (p value), que en nuestro
ejemplo vale 0,004749. Al ser menor del nivel de significacin habitualmente prefijado (0,05),
concluimos que las medias de presin arterial sistlica son diferentes en obesos y no
3
obesos.
Vamos a resumir aqu los pasos para evaluar la relacin entre obesidad y edad con el
subprograma ANALIZAR DATOS del programa EPI INFO en su versin 3.3.2 (2005).
Tras leer el fichero que contiene los datos, en la ventana Analysis buscamos Estadsticas
bsicas, y marcamos Medias. Se abrir un cuadro de dilogo donde es posible seleccionar
la variable cuantitativa en la ventana Medias de, y la variable categrica -que establece
los grupos de comparacin- en la ventana Tabulado por valores de. As mismo es posible
establecer ciertas Preferencias en la salida del anlisis.
3
Recurdese que este contraste lo hicimos en SPSS con una prueba no paramtrica (la U de Mann-
Whitney), porque la evaluacin de la normalidad de la distribucin de la variable presin arterial
sistlica result crtica y asumimos que no deberamos emplear la prueba de comparacin de medias
t de Student. El resultado fue parecido (p = 0,018) y la decisin la misma. Con el programa EPITABLE
corremos el riesgo de aplicar incorrectamente una prueba paramtrica si no hemos evaluado
previamente los requisitos para llevarla a cabo.
DocuWeb fabis.org 17 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
trata de comparar dos grupos, aparte del ANOVA hace un test T de Student, que puede comprobarse
que arroja un valor idntico al obtenido en el punto 1 paso 1 de este mismo documento, con una
probabilidad p asociada al contraste de 0,32 (no significativo).
Mtodos > Inferencia sobre parmetros > Dos poblaciones > Muestras independientes
Enseguida se abre una ventana donde debemos introducir datos: la media, la varianza y el
tamao (n) de cada grupo que se desea contrastar. El nivel de confianza (%) viene prefijado
en el 95%, pero puede modificarse.
DocuWeb fabis.org 18 de 20
Contraste de hiptesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociacin fabis.org, 2007
entre una variable cuantitativa y una categrica (comparacin de medias entre dos o
ms grupos independientes).
Tras entrar los datos solicitados se oprime en la barra de herramientas situada arriba el
icono que parece una pequea calculadora de bolsillo, obtenindose la siguiente salida:
Muestra 1 Muestra 2
-------------------- ---------- ----------
Media 48,697 50,235
Desviacin estndar 5,223 4,944
Tamao de muestra 33 17
Vemos como este programa tambin realiza una prueba previa para comprobar la igualdad de las
varianzas, y luego aporta dos aproximaciones: la diferencia de medias entre ambos grupos y su
intervalo de confianza, y la prueba de comparacin de medias t de Student. Los resultados son
idnticos a los obtenidos con el programa SPSS. De forma similar nos ofrece dos opciones de lectura,
segn sean o no homogneas las varianzas poblacionales.
DocuWeb fabis.org 19 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Anexo.
Tabla de datos del estudio sobre Hipertensin y Obesidad.
DocuWeb fabis.org 20 de 20