Está en la página 1de 6

Cap´ıtulo 5 Comparación de medias

5.1.1. Anova de una vı́ay método de Tukey. Alternativa de Kruskal-


Wallis
Este test es una generalización del de Student para dos muestra independientes que se
aplica para un mismo tipo de estudio y de diseño, con la salvedad de que podemos distinguir
un número de categorı́as y, por lo tanto, de medias, mayor de dos. Serı́a pues apropiado para
los datos del problema 8, en el que se trata de contrastar si las medias de glucemia son idénticas
en las cuatro categorı́as consideradas (control, respiratoria, metabólica y mixta):
H0 : µ1 = µ2 = µ3 = µ4
El test que resuelve el contraste se denomina anova de una v´ıa y requiere en principio de
las mismas condiciones que el test de Student para dos muestras independientes. Podemos

1
Cap´ıtulo 5 Comparación de medias

efectuar, no obstante, las mismas consideraciones acerca de los tamaños muestrales y también
contamos con alternativas como la de Brown-Forsyte y, especialmente, el test no paramétrico
de Kruskall-Wallis, que a su vez generaliza el de Mann-Whitney.
Ejercicio 101. ¿Qué sucederá si aplicamos el anova de una vı́a a un problema con dos medias?
En el caso del ejemplo 8 el resultado es P < 0.001. Quiere decir que las diferencias apre-
ciadas a nivel muestral son realmente significativas, por lo que existe relación entre la acidosis y
la glucemia. Para determinar de la manera más precisa en qué sentido se da dicha relación
debemos proceder a comparar las medias por parejas de manera simultánea: se trata del deno-
minado problema de comparaciones múltiples. Para ello tenemos a nuestra disposición diversos
procedimientos aunque, para simplificar, podemos optar por el método de Tukey, que es ideal en
el caso de que las muestras de las diferentes categorı́as sean de idéntico tamaño. Si hemos optado
por aplicar el test de Kruskal-Wallis, podemos utilizar las comparaciones múltiples de Dunnet.
Todo ello lo resumimos en la figura 5.3.

Figura 5.3: Procedimiento comparación más de dos medias

No significativo No relación
Normalidad o
Anova
muestras grandes
Significativo Tuckey

No significativo No relación
No normalidad y
muestras pequeñas Kruskal-Wallis

Significativo Relación

Para los datos del ejemplo 8 obtenemos el siguiente resultado en las comparaciones múlti-
ples:

Cuadro 5.4: Comparaciones múltiples acidosis


Nivel de glucemia en el cordón umbilical
a
HSD de Tukey
Subconjunto para alfa = 0.05

Tipo de acidosis N 1 2 3
Acidosis Mixta 50 62,61069
Control 50 62,67940
Acidosis Respiratoria 50 71,38224
Acidosis Metabólica 50 78,80371
Sig. 1,000 1,000 1,000
Se muestran las medias para los grupos en los subconjuntos
homogéneos.

Podemos apreciar que, tal y como se intu´ıa en la figura 2.19, la acidosis mixta no se asocia a
un cambio significativo de la glucemia mientras que la respiratoria y en especial la metabólica
la aumentan significativamente.

2
Cap´ıtulo 5 Otras cuestiones propuestas

5.1.2. Problemas de comparación de proporciones


Un problema estadı́stico muy común consiste en decidir si dos proporciones son o no iguales.
Dicho contratste podemos afrontarlo de dos formas diferentes con resultados muy similares. La
primera de ellas fue ya introducida en el cap´ıtulo 4 y consiste en entender la variable cualitativa
a cuyas proporciones nos referimos como una variable numérica con valores 1 (si la cualidad se
da) y 0 (en caso contrario), de manera que el problema planteado puede resolverse mediante el
test de Student para comparar dos medias con muestras independientes, siempre y cuando las
muestras sean lo suficientemente grandes como para poder asumir la normalidad aproximada
de la proporción muestral. Esta técnica posee la ventaja de que proporciona un intervalo de
confianza para la diferencia de proporciones.
La segunda técnica, la más utilizada, consiste en entender el problema como un estudio
de relación entre dos variables cualitativas y aplicar el test χ2 . El método puede extenderse
sin problemas a comparaciones de tres o más proporciones, siempre y cuando se verifiquen las
condiciones de validez del test.

5.1.3. Otras técnicas relacionadas


Sabemos que, en el problema de relación entre variables numéricas, es frecuente incrementar
el número de variables explicativas para poder pronosticar mejor la variable respuesta, dando
lugar a lo que conocemos como regresión múltiple. En el problema de relación entre una variable
numérica y otra cualitativa podemos obrar de la misma forma:
Podemos incrementar la cantidad de variables cualitativas para intentar explicar una
respuesta numérica, lo cual da pie al anova de dos vı́as u otras técnicas más complejas.
As´ı, para los datos del ejemplo 9, podemos intentar relacionar la edad de la menarqu´ıa
con el hecho de ser o no celiaca y la presencia o ausencia de dolor abdominal.

Podemos incrementar el número de variables numéricas para intentar explicar una res-
puesta cualitativa, lo cual da pie al análisis de regresión logı́stica. Por ejemplo, con los
datos del ejemplo 9, podemos hacer uso de la edad de la menarquı́a, la concentración de
hemoglobina y la de ant´ıgeno IgA para intentar diagnosticar la celiaqu´ıa.
Al margen de esto, presentamos en el cuadro 5.5 una s´ıntesis del cap´ıtulo. En la figura 5.4
pretendemos dar un resumen global de la materia tratada.

Cuadro 5.5: Resumen métodos básicos Inferencia


Problema Método paramétrico Método no paramétrico
Dos medias independientes Student (2) Mann-Whitney
Dos medias apareadas Student (1) Wilcoxon
Más de dos medias independientes Anova Kruskal-Wallis
Correlación lineal numéricas Correlación Pearson Correlación Spearman
Correlación cualitativas Test chi-cuadrado Test Exacto de Fisher

Otras cuestiones propuestas


Ejercicio 102. Consideremos nuevamente el estudio de la puntuación de ansiedad de Hamilton
en un grupo de 20 personas que viven solas y otras tantas que viven acompañadas. Los respec-
tivos diagramas de caja se muestran en la figura ??. Se indican a continuación los resultados

3
Cap´ıtulo 5 Otras cuestiones propuestas

Figura 5.4: Resumen general

Más
Anova-Tuckey
de dos

Numérica-cualitativa Comparación
medias

Dos Student

Relación variables Numérica-numérica Regresión-correlación, r2

Cualitativa-cualitativa Tabla de contingencia, C, Chi2

Factores riesgo RR, OR

del test de normalidad ed Shappiro-Wilk para ambas muestras, del test de Levene de igualdad
de varianzas, y de los test de Student, Welch y Mann-Whitney de comparación de medias (o
valores centrales).

Test P -valor
Shapiro-Wilk P=0.015(solos) P=0.272(acompañados)
Levene P=0.746
Student P<0.001
Welch P<0.001
Mann-Whitney P=0.004

A partir de los mismos y suponiendo que ambas muestras fueran aleatorias, contestar la si-
guiente pregunta: ¿existe relación entre el tipo de vida (en soledad o en compañı́a) y el nivel de
ansiedad? Indicar claramente en qué se basa la conclusión obtenida.
Ejercicio 103. A partir de los datos del archivo Enfermedad celiaca.sav estudia lo siguiente:

La relación entre la celiaquı́a y la concentración de IgA, por un lado, e IgG por otro.
¿Cuál de los dos anticuerpos puede resultar más útil para detectar la enfermedad?

La relación entre la edad de la menarquı́a y la concentración de hemoglobina.

¿Con qué aspecto guarda una relación más clara la enfermedad: con la presencia de dolor
abdominal o con la presencia de la variante genética DQ2? Cuantifica esa relación.

Ejercicio 104. A partir de los datos del archivo Próstata.sav:

Intenta explicar el volumen (log) del tumor a partir de la concentración de PSA (log) y la
edad del paciente.

Relaciona el PSA (log) con el pronóstico del tumor según la biopsia.

Relaciona el volumen (log) del tumor con el portecentaje de Gleason 4-5.

Relaciona el peso (log) del tumor con el portecentaje de Gleason 4-5. ¿Guarda más
relación que el volumen?

Ejercicio 105. A partir de los datos del archivo Acidosis.sav:

4
Cap´ıtulo 5 Otras cuestiones propuestas

Relaciona acidosis y glucemia.


Propón un método de diagnóstico concreto basado en la glucemia para diagnosticar aci-
dosis en recién nacidos.
Indica una estimación de la sensibilidad y especificidad del test propuesto.
Ejercicio 106. A partir de los datos del archivo Gonartrosis.sav:
Evalúa la evolución en movilidad (escala WOMAC) de las pacientes tratadas con criote-
rapia.
Relaciona la pérdida de autonomı́a con el IMC.
Estudia la eficacia de las diferentes técnicas de ultrasonido (1Mhz y 3Mhz) en la recupe-
ración de la movilidad.
Ejercicio 107. A partir de los datos del archivo Dieta.sav:
Estudia la eficacia del medicamento en la reducción de la presión sistólica.
Idem para la diastólica.
Ejercicio 108. A partir de los datos del archivo Hipoacusia.sav:
Relaciona la presencia de la enfermedad con los antecedentes familiares por un lado, y
con el nivel socioeconómico por otro.
¿Puedes indicar, a tenor de lo estudiado en el apartado anterior, un factor de riesgo claro
de cara a padecer hipoacusia?
Ejercicio 109. A partir de los datos del archivo South Africa Heart Disease.sav:
Relaciona la presencia de la enfermedad (chd) con la presión sistólica (sbp).
Relaciona la presencia de la enfermedad con el nivel de colesterol (ldl).
Relaciona la presencia de la enfermedad con el porcentaje de grasa corporal (adiposity).
Relaciona la presencia de la enfermedad con el consumo de alcohol.
Relaciona la presencia de la enfermedad con la edad. ¿Cuál de todas las variables men-
cionadas crees que guarda mayor relación con la enfermedad cardiaca?
Relaciona la presencia de la enfermedad con los antecedentes familiares.
Intenta explicar la presión sistólica a partir de la edad, el porcentaje de grasa corporal y el
nivel de colesterol ldl.
Ejercicio 110. En un estudio realizado en 68.183 mujeres adultas seguidas a lo largo de 16
años, aquellas que dormı́an 5 o menos horas no solo pesaban 2,5 kg más al inicio del estudio,
sino que también ganaron una media de 4,3 kg más en comparación con las que dormı́an 7
o más horas. Además, las mujeres con 5 o menos horas de sueño tuvieron un 32 % más de
posibilidades de ganar hasta 15 kg que las que dormı́an 7 o más horas a lo largo del estudio.
Esta diferencia persistı́a tras ajustar los resultados según la ingesta calórica y la actividad fı́sica.
Otros estudios muestran resultados similares también en los hombres. Se observó también que
tanto el ı́ndice de masa corporal como el perı́metro de cintura es significativamente mayor entre
aquellos que duermen menos de 5 horas. En concreto, dormir menos se asocia con un aumento
del perı́metro de la cintura de 6,7 cm para los hombres y de 5,4 cm para las mujeres.
¿Qué técnicas estadı́sticas (regresión lineal, test de Student, Wilcoxon, cálculos de medidas
de riesgo, etc) crees que se han utilizado para llegar a estas conclusiones?

5
Cap´ıtulo 5 Otras cuestiones propuestas

También podría gustarte