Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen
Cuando queremos evaluar el grado de asociación o independencia entre una variable cuantitativa y
una variable categórica (y recuérdese que ésta clasifica o diferencia a los individuos en grupos, tantos
como categorías tiene dicha variable), el procedimiento estadístico inferencial recurre a comparar las
medias de la distribuciones de la variable cuantitativa en los diferentes grupos establecidos por la
variable categórica. Si ésta tiene solo dos categorías (es dicotómica), la comparación de medias entre
dos grupos independientes se lleva a cabo por el test t de Student; si tiene tres o más categorías, la
comparación de medias entre tres o más grupos independientes se realiza a través de un modelo
matemático más general, el Análisis de la Varianza (ANOVA). En ambos casos, las pruebas
estadísticas son exigentes con ciertos requisitos previos: la distribución Normal de la variable
cuantitativa en los grupos que se comparan y la homogeneidad de varianzas en las poblaciones de
las que proceden los grupos; su no cumplimiento conlleva la necesidad de recurrir a pruebas
estadísticas no paramétricas. En este documento se enseña a hacer estos análisis con el programa
SPSS para Windows, y alternativamente con los programas EPIINFO 6.0 y su versión 3.3.2
(actualizada en 2005) y con el programa EPIDAT 3.1.
0. INTRODUCCIÓN TEÓRICA.
Cuando tengamos que evaluar la asociación entre una variable categórica (o nominal) y una
variable cuantitativa, el procedimiento es analizar y comparar las medias de la distribución de
la variable cuantitativa en cada uno de los grupos que conforma la variable categórica.
Si la variable cualitativa sólo tiene dos categorías (por ejemplo la variable sexo) el
procedimiento se reduce a comparar las medias de la variable cuantitativa en esos dos
grupos (hombres y mujeres en el ejemplo). El contraste de hipótesis es la t de Student, para
comparar las medias (de la variable contínua) en dos grupos independientes, que en SPSS
está en:
Analizar > Comparar medias > Prueba t para dos muestras independientes
Si la variable categórica tiene tres o más categorías (por ejemplo la variable raza con las
siguientes mediciones: blanca, negra, otras) el procedimiento también consiste en comparar
las medias de la variable cuantitativa en cada uno de los grupos que conforma cada estrato
o categoría de la variable nominal, pero el procedimiento ya no es la t de Student sino un
modelo matemático más amplio: el Análisis de la Varianza (ANOVA de una vía), que va a
permitir no sólo saber si hay diferencias en las medias en los diferentes grupos sino explorar
Correspondencia: marianoaguayo@telefonica.net
1 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
entre qué grupos concretos están o no esas diferencias (a través de los llamados “contrastes
a posteriori”). El análisis en SPSS está en:
a) La variable cuantitativa debe distribuirse según la Ley Normal en cada uno de los
grupos que se comparan (CRITERIO DE “NORMALIDAD”).
El primero es el más importante. Aunque puede asumirse que se cumple para muestras
grandes (n > 100), debe explorarse siempre, con gráficos y pruebas de normalidad.1 En
SPSS las pruebas de normalidad más completas están en la opción “EXPLORAR” y al que
se llega con la rutina:
Con respecto al segundo requisito para aplicar estos contrastes (ANOVA y t de Student), es
menos exigente, y existen alternativas para hacer el contraste. Así veremos que en SPSS
hay una lectura de la prueba “asumiendo varianzas desiguales”.
Vamos a trabajar con el ejemplo del estudio de obesidad e hipertensión. En esta base de
datos, la variable obesidad es categórica (obeso / no obeso) y desearíamos saber si está
relacionada con la edad de los individuos (una variable cuantitativa, cuya medida son los
años cumplidos), esto es, responder a la pregunta ¿hay diferencias en la edad de los
individuos según sean o no obesos? O de forma alternativa, ¿está relacionada la edad con
la presencia de obesidad?
1
Debe recordarse aquí también que en determinados casos en que una variable cuantitativa no sigue
una Ley Normal puede transformarse mediante una operación matemática (por ejemplo una
transformación logarítmica), consiguiendo entonces que su “transformada” sí cumpla el criterio de
normalidad. Merece la pena probar antes de optar por una prueba no paramétrica.
DocuWeb fabis.org 2 de 20
Contraste de hipótesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociación fabis.org, 2007
entre una variable cuantitativa y una categórica (comparación de medias entre dos o
más grupos independientes).
En la pestaña de “Gráficos”
elegimos la opción Gráficos con
pruebas de normalidad. Vemos
que esta ventana de Explorar >
Gráficos también es posible obtener:
Explorar
PRESENCIA DE OBESIDAD
Primero se muestra un resumen de los casos (individuos) que se van a explorar o procesar.
Resumen del procesamiento de los casos
Casos
PRESENCIA Válidos Perdidos Total
DE OBESIDAD N Porcentaje N Porcentaje N Porcentaje
EDAD EN AÑOS obeso 33 100,0% 0 ,0% 33 100,0%
CUMPLIDOS no obeso 17 100,0% 0 ,0% 17 100,0%
Luego un cuadro resumen con la estadística descriptiva de la variable cuantitativa (el dependiente
para el programa SPSS) en cada uno de los grupos establecidos por las diferentes categorías e la
variable cualitativa (el factor para el programa SPSS).
En esta salida podemos ver un aspecto muy interesante: los IC95% para la media en cada grupo, una
forma alternativa al contraste de hipótesis clásico para tomar decisiones sobre la relación entre
variables
DocuWeb fabis.org 3 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Descriptivos
PRESENCIA Estadístico Error típ.
EDAD EN AÑOS DE OBESIDAD
obeso Media 48,70 0,90
CUMPLIDOS Intervalo de confianza Límite inferior 46,84 9
para la media al 95% Límite superior
50,55
.
En nuestro ejercicio vemos que, tanto la estimación puntual de la media de la variable “edad” en
ambos grupos (48,70 vs 50,24) como sus intervalos de confianza (46,84 – 50,55 en el grupo “obeso”
vs 47,89 – 52,78 en el grupo “no obeso”) son muy “superponibles”, por lo que es altamente
improbable que las variables edad y obesidad estén relacionadas en la población (lo que conllevaría a
que las edades medias en ambos grupos fueran muy diferentes).
Seguidamente, se nos muestra las pruebas de normalidad que lleva a cabo el programa SPSS. Nos
hemos de fijar en la significación estadística de estos dos contrastes, asumiendo la normalidad de la
distribución si en ambos grupos el nivel de “p” es no significativo (esto es, p>0,05). En nuestro
ejemplo podemos asumir la normalidad de la variable cuantitativa “edad” en ambos grupos (“obesos” /
“no obesos”).
Pruebas de normalidad
a
PRESENCIA Kolmogorov-Smirnov Shapiro-Wilk
DE OBESIDAD Estadístico gl Sig. Estadístico gl Sig.
EDAD EN AÑOS obeso ,124 33 ,200* ,951 33 ,142
CUMPLIDOS no obeso ,145 17 ,200* ,950 17 ,450
*. Este es un límite inferior de la significación verdadera.
a. Corrección de la significación de Lilliefors
obeso
0
Frequency Stem & Leaf
3,00 4 . 111
-1
5,00 4 . 22333
-2
40 45 50 55 60
Valor observado
DocuWeb fabis.org 4 de 20
Contraste de hipótesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociación fabis.org, 2007
entre una variable cuantitativa y una categórica (comparación de medias entre dos o
más grupos independientes).
4,00 4 . 4555
2,00 4 . 77
60
3,00 4 . 899
4,00 5 . 0001
6,00 5 . 222333
3,00 5 . 445
2,00 5 . 77
55
Stem width: 10
Each leaf: 1 case(s)
50
2,00 4 . 22
7,00 4 . 7778889
5,00 5 . 02344
3,00 5 . 779 40
0
Como puede verse en nuestro ejemplo, las edades
medias en el grupo “no obeso” son ligeramente
mayores que en el grupo “obeso”, pero las
-1 medianas son idénticas y un amplio porcentaje de
individuos (los situados dentro de cada caja, el 50%
de cada muestra) tienen unas edades muy
40 45 50 55 60 parecidas.
Valor observado
Con lo ya visto hasta ahora tenemos una
aproximación inferencial sin necesidad de recurrir al contraste. Tanto el análisis de los
intervalos de confianza de las medias como el estudio de los gráficos de caja nos permiten
una evaluación de hasta qué punto pueden estas dos variables estar relacionadas en la
población de la que proviene la muestra. Es muy probable que no estén asociadas. Pero
para completar el análisis inferencial debemos recurrir al contraste de hipótesis.
H0 → µ1 = µ2
DocuWeb fabis.org 5 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Prueba T
Estadísticos de grupo
Primero se muestran los estadísticos resumen en cada grupo: N (tamaño), media, desviación típica y
el error estándar de la media.
Luego el programa SPSS nos aporta información de la prueba T en un único cuadro resumen, donde
se nos ofrecen varias cosas, que no debemos confundir:
• Una prueba de homogeneidad de varianzas (la prueba de Levene), que nos va a informar
sobre el segundo requisito para aplicar la comparación de medias mediante la prueba t de
Student: la homogeneidad de varianzas. El programa hace un contraste a través del
estadístico F de Snedecor y nos aporta una significación estadística, o valor “p” asociado a la
hipótesis nula de que “las varianzas son homogéneas” (señalado en color naranja en el
siguiente cuadro). Cuando ese valor “p” es significativo (p<0,05) debemos dudar de la
homogeneidad de varianzas.
• Una doble salida de la comparación de medias en los dos grupos, expresada en dos
filas de la ventana:
o en la fila superior la salida es cuando se han asumido varianzas iguales en el
2
Vemos como también es posible agrupar por una variable cuantitativa estableciendo un “punto de
corte”, lo que la transformaría de facto en una variable categórica con dos niveles o estratos.
DocuWeb fabis.org 6 de 20
Contraste de hipótesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociación fabis.org, 2007
entre una variable cuantitativa y una categórica (comparación de medias entre dos o
más grupos independientes).
Prueba de Levene
para la igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
Diferencia Error típ. de diferencia
F Sig. t gl Sig. (bilateral) de medias la diferencia Inferior Superior
EDAD EN AÑOS Se han asumido
,273 ,604 -1,004 48 ,320 -1,538 1,532 -4,619 1,542
CUMPLIDOS varianzas iguales
No se han asumido
-1,022 34,059 ,314 -1,538 1,505 -4,596 1,520
varianzas iguales
Por otra parte, si interpretamos la diferencia de medias de edad entre ambos grupos, ésta se
situaría en la población, con una elevada confianza, entre -4,619 y +1,542 años. Es una
estimación algo imprecisa (unos cinco años arriba o abajo) y contiene el valor “cero”, que
nos hace llegar a la misma conclusión: por la variabilidad del muestreo (error aleatorio) es
posible explicar las pequeñas diferencias de medias de edad (1,53 años) encontradas en
nuestro estudio, por lo que debemos asumir la no-diferencia de medias de edad en la
población.
3. Vamos a ver ahora cómo proceder cuando no es posible aplicar una prueba t de
Student, empleando entonces una prueba no paramétrica.
DocuWeb fabis.org 7 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Como en el ejercicio anterior, lo primero es comprobar si se dan los requisitos para aplicar
las pruebas paramétricas, basadas en la media y la varianza. Esto es, hay que explorar
cómo es la distribución de la variable “TAS” en cada grupo determinado por la variable
“obesidad”, solicitando pruebas de normalidad que nos permitan tomar una decisión.
Explorar
PRESENCIA DE OBESIDAD
Resumen del procesamiento de los casos
Casos
PRESENCIA Válidos Perdidos Total
DE OBESIDAD N Porcentaje N Porcentaje N Porcentaje
PRESIÓN ARTERIAL obeso 33 100,0% 0 ,0% 33 100,0%
SISTÓLICA no obeso 17 100,0% 0 ,0% 17 100,0%
Como podemos ver en el cuadro resumen de estadísticos, la media de TAS en los dos grupos de
comparación (“obesos” / “no obesos”) es más elevada en el grupo de no obesos (144,95 con un IC95%
entre 131,15 y 158,73) que en el grupo de obesos (125,97 con un IC95% entre 119,47 y 132,47). La
diferencia puntual de estas medias es:
… ¡casi 19 mm de Hg más alta en no obesos!; y los IC95% de las medias en ambos grupos se
superponen en un rango muy corto (el que va desde 131,15 a 132,47). Es probable que ambas
medias sean estadísticamente diferentes y que podamos concluir que las dos variables (TAS y
Obesidad) están asociadas en la población de la que proviene la muestra.
El programa nos muestra ahora las pruebas de normalidad, para tomar una decisión sobre la
adecuación de los test paramétricos a la comparación de medias.
DocuWeb fabis.org 8 de 20
Contraste de hipótesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociación fabis.org, 2007
entre una variable cuantitativa y una categórica (comparación de medias entre dos o
más grupos independientes).
Pruebas de normalidad
a
PRESENCIA Kolmogorov-Smirnov Shapiro-Wilk
DE OBESIDAD Estadístico gl Sig. Estadístico gl Sig.
PRESIÓN ARTERIAL obeso ,203 33 ,001 ,930 33 ,036
SISTÓLICA no obeso ,163 17 ,200* ,958 17 ,587
*. Este es un límite inferior de la significación verdadera.
a. Corrección de la significación de Lilliefors
Ambas pruebas de normalidad muestran que en el grupo “obeso” la variable TAS no se distribuye
según una Ley Normal, ya que la ”p” asociada a los contrastes de K-S (0,001) y S-W (0,036) da por
debajo del nivel de significación alfa prefijado (0,05). Esto nos obligará a tomar un camino diferente en
el análisis de la relación entre estas dos variables, optando por pruebas no paramétricas.
120
Llegados a este punto, si deseamos hacer un
contraste de hipótesis para evaluar hasta qué punto
100 las medias de TAS son diferentes, debemos optar
por una de las Pruebas no paramétricas > (para…)
80
2 muestras independientes, con el casi
obeso no obeso
PRE SE NC IA DE OB ESIDA D convencimiento de que el test va a ser
estadísticamente significativo.
Se pueden elegir entre varios Tipo de prueba, siendo la más común la “U de Mann-
Whitney”, señalada por defecto en el programa
SPSS. Tras aplicar, la salida es la siguiente:
Pruebas no paramétricas
Estadísticos descriptivos
Desviación
N Media típica Mínimo Máximo
PRESIÓN ARTERIAL
50 132,42 23,168 95 190
SISTÓLICA
PRESENCIA DE
50 1,34 ,479 1 2
OBESIDAD
DocuWeb fabis.org 9 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Prueba de Mann-Whitney
Rangos
Estadísticos de contrastea
PRESIÓN
ARTERIAL
SISTÓLICA
U de Mann-Whitney 166,500
W de Wilcoxon 727,500
Z -2,358
Sig. asintót. (bilateral) ,018
a. Variable de agrupación: PRESENCIA DE OBESIDAD
Tras hacer un pequeño resumen de los casos procesados a través de sus estadísticos descriptivos
(tamaño muestral, media, desviación típica y valores máximo y mínimo), el programa procesa la
información contenida en la variable cuantitativa en cada grupo, y calcula varios estadísticos de
contraste. Lo que debemos interpretar es la Sig. Asintótica (bilateral), que en nuestro caso vale
0,018 y lleva a concluir que se rechaza la hipótesis nula de que “la media de TAS es similar en ambos
grupos”; o lo que es alternativamente igual, “que existe una asociación estadísticamente significativa
entre la TAS y la Obesidad)”.
H0 → µ1 = µ2 = µ3 … = µn
Esto es, con que exista una media diferente a las demás, el test estadístico será significativo
al nivel alfa establecido.
El ANOVA tiene las mismas exigencias que la t de Student: requiere que la variable
cuantitativa se distribuya según una Ley Normal en cada uno de los grupos a comparar, y
además exige que las varianzas sean homogéneas.
Vamos a realizar una prueba de ANOVA, para lo cual vamos a convertir la variable cuantitativa “edad”
de la base de datos OBESIDAD Y HTA en una variable categórica (“edadrec”) con tres categorías:
a) “menos de 47 años”
b) “de 47 a 52 años”
c) “más de 52 años”
Y ahora desearíamos comprobar si existe relación entre la presión arterial sistólica (TAS) y los tres
segmentos de edad establecidos por “edadrec”. Consistiría en “evaluar si las medias de TAS son
diferentes en los grupos de edad, y si fuese así en qué sentido y en qué estratos etarios”.
DocuWeb fabis.org 10 de 20
Contraste de hipótesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociación fabis.org, 2007
entre una variable cuantitativa y una categórica (comparación de medias entre dos o
más grupos independientes).
Cases
EDAD EN AÑOS Valid Missing Total
CUMPLIDOS (Banded) N Percent N Percent N Percent
PRESIÓN ARTERIAL Menos de 47 años 19 100,0% 0 ,0% 19 100,0%
SISTÓLICA De 47 a 52 años 16 100,0% 0 ,0% 16 100,0%
Más de 52 años 15 100,0% 0 ,0% 15 100,0%
Tests of Normality
a
EDAD EN AÑOS Kolmogorov-Smirnov Shapiro-Wilk
CUMPLIDOS (Banded) Statistic df Sig. Statistic df Sig.
PRESIÓN ARTERIAL Menos de 47 años ,278 19 ,000 ,823 19 ,002
SISTÓLICA De 47 a 52 años ,193 16 ,112 ,850 16 ,013
Más de 52 años ,117 15 ,200* ,953 15 ,574
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
160
120
100
80
DocuWeb fabis.org 11 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Con los datos previos ya intuímos que no van a encontrarse diferencias estadísticamente
significativas entre las medias de “TAS” al comparar los tres grupos de edad.
Por otra parte no sería demasiado correcto aplicar un ANOVA, ya que la variable
“TAS” no se distribuye como una Normal en los grupos de comparación. De todas
formas, y con carácter puramente instructivo, vamos llevar a cabo el contraste.
También debemos explorar los contenidos de la pestaña “Opciones...”, para solicitar una
prueba de homogeneidad de varianzas y, si lo deseamos, un resumen de los principales
descriptivos en cada grupo de comparación.
DocuWeb fabis.org 12 de 20
Contraste de hipótesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociación fabis.org, 2007
entre una variable cuantitativa y una categórica (comparación de medias entre dos o
más grupos independientes).
ANOVA de un factor
Primero se nos muestra un cuadro resumen con los estadísticos descriptivos (de la variable
cuantitativa) más relevantes en cada grupo que se va a contrastar: las medias (y sus IC95%), las
desviaciones típicas y los valores máximo y mínimo.
Descriptivos
Luego, el programa SPSS nos ofrece un test para evaluar la homogeneidad de varianzas: es el mismo
que se aplicaba de rutina en el procedimiento comparación de medias en dos grupos independientes
(prueba T): el test de Levene. En nuestro ejemplo la significación estadística “p” vale 0.056, pudiendo
asumirse la homogeneidad de varianzas (aunque en el límite de la no significación).
Por último, aparece la salida del ANOVA propiamente dicho, con sus diferentes componentes o
fuentes de variabilidad: la inter-grupos y la intra-grupos. Esta última representaría la variabilidad o
dispersión que no es explicada por el factor de agrupamiento (la variable categórica), y que sería
explicable sólo por el azar.
ANOVA
Para llevar a cabo el contraste, se recurre al estadístico F de Snedecor, que en nuestro ejemplo vale
0.416 y tiene un valor “p” asociado de 0.662 (no significativo). Con esto concluiríamos nuestra
evaluación, diciendo que “las variables TAS y grupos de edad no muestran asociación”; o que “se
acepta la hipótesis nula de que las medias de TAS son iguales en los diferentes grupos de
edad”. En este caso no habría lugar a evaluar los contrastes a posteriori, puesto que no se han
encontrado diferencias significativas en el ANOVA. Aún así mostramos la salida de SPSS:
DocuWeb fabis.org 13 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
En el cuadro de comparaciones múltiples vemos que cada grupo de edad se compara con los otros
dos, obteniéndose en cada contraste la diferencia de medias, el IC95%, el error estándar y el
valor”p”asociado, que en todos los casos es no-significativo, como ya sabíamos que iba a suceder.
La salida que obtendremos, tras dar al botón de aceptar, será la siguiente (nos hemos
pasado ahora a la versión en inglés del programa SPSS 13.0):
Luego aparece la prueba de contraste, el test de Kruskal-Wallis, con los tamaños de muestra (N) y los
rangos promedio para cada uno de los grupos a comparar. Y después, en una segunda tabla, aparece
el estadístico Chi-cuadrado, que vale 0,487, sus grados de libertad (el número de grupos -3- menos
uno), y su significación estadística (p = 0,784). Llegamos a la misma conclusión que con el ANOVA:
DocuWeb fabis.org 14 de 20
Contraste de hipótesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociación fabis.org, 2007
entre una variable cuantitativa y una categórica (comparación de medias entre dos o
más grupos independientes).
Ranks
EDAD EN AÑOS N Mean Rank
PRESIÓN ARTERIAL CUMPLIDOS
Menos (Banded)
de 47 años 19 23,71
SISTÓLICA De 47 a 52 años 16 26,28
Más de 52 años 15 26,93
Total 50
a,b
Test Statistics
PRESIÓN
En este ejemplo sólo puede concluirse que no tenemos
ARTERIAL pruebas para rechazar la hipótesis nula, esto es
Chi-Square
SISTÓLICA
,487
aceptaremos la igualdad de medias en la población de la
df 2 que proviene la muestra y concluiremos diciendo que
Asymp. Sig. ,784 “no se han encontrado argumentos que relacionen la
a. Kruskal Wallis Test TAS con los tres rangos de edad analizados”. Por otra
b. Grouping Variable: EDAD EN
parte, si hubiésemos detectado diferencias hemos de
AÑOS CUMPLIDOS (Banded)
aclarar que con este tipo de contrastes no paramétricos
no es posible realizar contrastes a posteriori.
Vamos a trabajar con el mismo ejemplo que en el apartado 1 paso 3, esto es, vamos a
comparar las medias de “TAS” entre los dos grupos establecidos por la variable “Obesidad”
(“obesos” / “no obesos”). Pero en este caso ya tenemos calculados sus índices resumen: la
media, la varianza y el tamaño muestral.
¿Existe asociación? Presión arterial sistólica
Obesidad N Media Varianza Desv. Estándar
Obeso 33 125,97 336,030 18,331
No obeso 17 144,94 719,434 26,822
DocuWeb fabis.org 15 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Y ahora debemos introducir los datos que nos pide la calculadora: la media, la desviación
estándar y el tamaño de la muestra, para cada grupo (“obesos” y “no obesos”). Mostramos a
continuación la salida para el grupo “obesos”:
El intervalo de confianza al 95% que nos da el programa EPI INFO (119,72 – 132,22) es ligeramente
más pequeño que el que aportaba el programa SPSS para la misma media (119,47 – 132,47). De
forma similar se haría el cálculo en el otro grupo (“no obesos”), y con ambos intervalos de confianza
deberíamos tomar la decisión de… “hasta qué punto ambas medias en la población serían diferentes”.
1.2. En segundo lugar, procedamos a comparar las medias de TAS en los dos
grupos. Esta es la aproximación inferencial más clásica, a través del contraste
de hipótesis. En la calculadora estadística EPITABLE se realiza a través de la
opción Compare > Means
Una vez abierta la ventana de diálogo, nos pide cuantas muestras o grupos vamos a
comparar (¿how many samples?). En nuestro ejemplo son solo dos (“obesos” y “no
obesos”), por lo que señalamos 2 y aceptamos. El programa nos ofrece una nueva ventana
DocuWeb fabis.org 16 de 20
Contraste de hipótesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociación fabis.org, 2007
entre una variable cuantitativa y una categórica (comparación de medias entre dos o
más grupos independientes).
para hacer un ANOVA para dos grupos, debiendo introducir para cada uno de los grupos la
media, la varianza y el tamaño.
Al aceptar (Calculate) el programa nos ofrece la salida de un Análisis de la Varianza (ANOVA), con la
variabilidad intergrupos (Variance between samples), la varianza residual (Residual variance), el
estadístico de contraste de Snedecor (F Statistic) y el valor ”p” asociado (p value), que en nuestro
ejemplo vale 0,004749. Al ser menor del nivel de significación habitualmente prefijado (0,05),
concluimos que “las medias de presión arterial sistólica son diferentes en obesos y no
3
obesos”.
Vamos a resumir aquí los pasos para evaluar la relación entre obesidad y edad con el
subprograma ANALIZAR DATOS del programa EPI INFO en su versión 3.3.2 (2005).
Tras leer el fichero que contiene los datos, en la ventana Analysis buscamos Estadísticas
básicas, y marcamos Medias. Se abrirá un cuadro de diálogo donde es posible seleccionar
la variable cuantitativa en la ventana “Medias de”, y la variable categórica -que establece
los grupos de comparación- en la ventana “Tabulado por valores de”. Así mismo es posible
establecer ciertas Preferencias en la salida del análisis.
3
Recuérdese que este contraste lo hicimos en SPSS con una prueba no paramétrica (la U de Mann-
Whitney), porque la evaluación de la normalidad de la distribución de la variable “presión arterial
sistólica” resultó crítica y asumimos que no deberíamos emplear la prueba de comparación de medias
t de Student. El resultado fue parecido (p = 0,018) y la decisión la misma. Con el programa EPITABLE
corremos el riesgo de aplicar incorrectamente una prueba paramétrica si no hemos evaluado
previamente los requisitos para llevarla a cabo.
DocuWeb fabis.org 17 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
trata de comparar dos grupos, aparte del ANOVA hace un test T de Student, que puede comprobarse
que arroja un valor idéntico al obtenido en el punto 1 paso 1 de este mismo documento, con una
probabilidad ”p” asociada al contraste de 0,32 (no significativo).
Métodos > Inferencia sobre parámetros > Dos poblaciones > Muestras independientes
Enseguida se abre una ventana donde debemos introducir datos: la media, la varianza y el
tamaño (n) de cada grupo que se desea contrastar. El nivel de confianza (%) viene prefijado
en el 95%, pero puede modificarse.
DocuWeb fabis.org 18 de 20
Contraste de hipótesis con SPSS y alternativamente con EPIINFO y EPIDAT(II): Asociación fabis.org, 2007
entre una variable cuantitativa y una categórica (comparación de medias entre dos o
más grupos independientes).
Tras entrar los datos solicitados se oprime en la barra de herramientas situada arriba el
icono que parece una pequeña calculadora de bolsillo, obteniéndose la siguiente salida:
Muestra 1 Muestra 2
-------------------- ---------- ----------
Media 48,697 50,235
Desviación estándar 5,223 4,944
Tamaño de muestra 33 17
Vemos como este programa también realiza una prueba previa para comprobar la igualdad de las
varianzas, y luego aporta dos aproximaciones: la diferencia de medias entre ambos grupos y su
intervalo de confianza, y la prueba de comparación de medias t de Student. Los resultados son
idénticos a los obtenidos con el programa SPSS. De forma similar nos ofrece dos opciones de lectura,
según sean o no homogéneas las varianzas poblacionales.
DocuWeb fabis.org 19 de 20
Aguayo Canela, Mariano DocuWeb fabis.org
Anexo.
Tabla de datos del estudio sobre Hipertensión y Obesidad.
DocuWeb fabis.org 20 de 20