Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INVESTIGACIÓN 52.965
La estadística es la ciencia que permite to- cesario conocer ni suponer nada acerca de
mar decisiones en situaciones de incerti- las variancias poblacionales. La mayoría no
dumbre1. Estas decisiones se basan con requiere el supuesto de linealidad.
▲
▲
LECTURA RÁPIDA
frecuencia en inferir a partir de muestras, Cuando se dan las condiciones de aplica-
tanto para estimar valores en las poblacio- ción, las pruebas paramétricas tienen más
nes como para realizar pruebas de contras- potencia que las no paramétricas, pero,
te de hipótesis. Básicamente, el propósito cuando esto no es así, el riesgo alfa puede ▼
de las pruebas de hipótesis es obtener con- ser mayor que el especificado de antema- La estadística es la ciencia
clusiones sobre los parámetros de la pobla- no5, es decir, se aumenta la probabilidad de que permite tomar
ción (media, proporción u otros) basándo- afirmar una diferencia entre grupos que no decisiones en situaciones
nos en los resultados obtenidos en existe, que podríamos traducir como que se de incertidumbre.
muestras aleatorias2. La estadística ha de- incrementa la probabilidad de cometer un ▼
sarrollado dos grupos de pruebas para to- falso positivo6. El propósito de las pruebas
mar decisiones de este tipo: pruebas para- Una estrategia posible sería utilizar siem- de hipótesis es obtener
métricas y pruebas no paramétricas. pre pruebas no paramétricas ya que, si se conclusiones sobre los
Las pruebas paramétricas tienen en cuenta dan las condiciones de aplicación, la pérdi- parámetros de la población
los parámetros en las poblaciones. Para su da de potencia no es muy grande y, si no se (media, proporción u
utilización es necesario que se de una serie dan, son los métodos que deben emplearse. otros) basándonos en los
de requisitos o supuestos que, en caso de Es conocido que los métodos no paramé- resultados obtenidos en
no cumplirse, impiden su utilización3,4: la tricos tienen una alta potencia cuando se muestras aleatorias.
escala de medida debe ser de intervalo o dan las condiciones de aplicación de las pa- ▼
razón; las observaciones deben ser inde- ramétricas y tienen muy pocas probabilida- Las pruebas paramétricas
pendientes unas de otras; las variancias po- des de conducir a una conclusión distinta tienen en cuenta los
blacionales de las variables en estudio de- de la obtenida por los métodos tradiciona- parámetros en las
ben ser similares (homocedasticidad); la les paramétricos7. poblaciones. Para su
relación entre las variables debe ser de tipo Otra alternativa es la utilización de los lla- utilización es necesario que
se de una serie de
lineal, y la distribución de las variables en mados métodos robustos. Estos métodos
requisitos o supuestos.
la población debe seguir una ley normal. son menos potentes que los paramétricos,
Las pruebas no paramétricas no necesitan pero se muestran superiores a los no para- ▼
estas condiciones previas de aplicación. métricos clásicos. Entendemos por poten- Las pruebas no
Pueden utilizarse para analizar variables cia o poder de un test la probabilidad de paramétricas no necesitan
nominales y ordinales. La distribución po- elegir la hipótesis alternativa cuando es estas condiciones previas
de aplicación.
blacional puede ser cualquiera y no es ne- cierta, es decir, la capacidad para encontrar
diferencias significativas cuando es cierto ▼
que existen8,9. Cuando se dan las
La principal de sus ventajas es que no se condiciones de aplicación,
afectan por la existencia de datos anóma- las pruebas paramétricas
aServicio
de Epidemiología. Gobierno de La Rioja.
tienen más potencia que
Logroño. España. los, como, por ejemplo, algunos datos muy
bServicio de Pediatría. Hospital Río Carrión. Palencia. las no paramétricas, pero,
extremos (outliers), y que no requieren los
España. cuando esto no es así, el
Correspondencia:
supuestos de aplicación de las pruebas pa- riesgo alfa puede ser mayor
Enrique Ramalle-Gómara. ramétricas. que el especificado de
Servicio de Epidemiología.
C/ Villamediana, 17. Cuando una distribución cualquiera pre- antemano.
26071 Logroño. La Rioja. España.
Correo electrónico: ramalle@larioja.org senta datos anómalos, existe el hábito ge-
neralizado de eliminarlos, proceso eufe-
Manuscrito recibido el 22 de julio de 2002.
místicamente llamado de limpieza o
▲
Ramalle-Gómara E, et al.
INVESTIGACIÓN Utilización de métodos robustos en la estadística inferencial
LECTURA RÁPIDA
Estimador Estrategia Resultado con los datos
(1, 2, 3, 4, 5, 100)
(media aritmética: 19,2)
Ramalle-Gómara E, et al.
Utilización de métodos robustos en la estadística inferencial INVESTIGACIÓN
▲
▲
Estimador Estrategia Resultado con los datos LECTURA RÁPIDA
(1, 2, 3, 4, 5, 100)
(media aritmética: 39,6)
Ramalle-Gómara E, et al.
INVESTIGACIÓN Utilización de métodos robustos en la estadística inferencial
■ TABLA Resultados de las distintas pruebas Ejemplo para la comparación de más de dos
7 para la comparación de más de dos medias
▼ medias
Métodos robustos para Como ejemplo de la utilidad de los méto-
el contraste de hipótesis Prueba de contraste de hipótesis Nivel de significación dos robustos para el análisis de la variancia
Con los parámetros antes Test de ANOVA 0,08 continuamos utilizando a otros 73 pacien-
referidos, se pueden
Test de Kruskal-Wallis 0,09 tes ingresados en una UCI y queremos
construir intervalos de comparar las estancias generadas en dicha
Método robusto media (α-recortada) 0,02
confianza robustos y unidad entre tres grupos de pacientes cla-
realizar contrastes de sificados en función de la edad (jóvenes,
hipótesis.
maduros y ancianos). Las características
▼ La variable estancia, como casi todas las que los describen se resumen en la tabla 6.
El test de Yuen es una que se refieren al tiempo, es una variable Por otro lado, el test de Levene para valo-
alternativa a las pruebas de conocida por su distribución alejada de lo rar la homogeneidad de las variancias (ho-
la t de Student y U de normal. Si el tamaño de los grupos que se mocedasticidad) muestra que existen dife-
Mann-Whitney para
estudian es pequeño –menor de 30–, no rencias entre ellas (p = 0,027). Por lo tanto,
tamaños muestrales
sería adecuada la utilización de métodos existen varios incumplimientos (ausencia
pequeños y distribuciones
no normales.
paramétricos (t de Student) y deberíamos de normalidad y homocedasticidad, y exis-
recurrir a los clásicos no paramétricos (U tencia de valores anómalos outliers) que
▼ de Mann-Whitney). Sin embargo, en este impiden la utilización de métodos paramé-
Ejemplo para la comparación caso concreto ninguna de estas dos opcio- tricos (ANOVA clásico) en este ejemplo y
de más de dos medias
nes tiene potencia suficiente para detectar deberíamos recurrir a los clásicos no para-
Para comparar más de dos
diferencias significativas. La potencia es la métricos de Kruskal-Wallis o, mejor, a mé-
medias, cuando no puede
utilizarse el ANOVA
capacidad para encontrar diferencias signi- todos robustos como la generalización ro-
clásico, deberíamos recurrir ficativas cuando es cierto que existen8. Sin busta del test Welch, que utiliza medias
a los clásicos no embargo, el test robusto de Yuen, que uti- α-recortadas muestrales y es capaz de de-
paramétricos de Kruskal- liza medias α-recortadas muestrales, es ca- tectar diferencias significativas entre los
Wallis o, mejor, a métodos paz de detectar diferencias significativas grupos (tabla 7).
robustos como la entre ambos grupos (tabla 5).
generalización robusta del Por tanto, el test de Yuen es una alternati- Ejemplo para el análisis de correlación y regre-
test Welch, que utiliza va a las pruebas de la t de Student y U de sión lineal
medias a-recortadas Mann-Whitney para tamaños muestrales Por último, para comparar los distintos
muestrales.
pequeños y distribuciones no normales. métodos en los análisis de correlación y re-
▲
X (edad) (n = 22) 63, 79, 53, 20, 23, 18, 19, 16, 45, 30, 16, 67, 71, 50,27 58,00 p = 0,04
73, 71, 76, 77, 75, 27, 86, 76, 25
Y (estancia) (n = 22) 18, 21, 9, 87, 3, 6, 5, 2, 1, 3, 1, 16, 25, 23, 11, 21, 14,50 10,00 p = 0,002
18, 4, 2, 25, 17, 1
K-S-L: prueba de Kolmogorov-Smirnov, con corrección de Lilliefors para la comprobación del supuesto de normalidad.
Ramalle-Gómara E, et al.
Utilización de métodos robustos en la estadística inferencial INVESTIGACIÓN
FIGURA
Rectas de regre- Valor extremo
1 sión obtenidas por
▲
▲
80 LECTURA RÁPIDA
mínimos cuadra-
dos y por el esti-
mador robusto de 60
regresión medio
biponderado.
Días de estancia
40 Deberíamos recurrir a
métodos no paramétricos
(Spearman) o, mejor, a
20
métodos robustos como el
coeficiente de porcentaje
ajustado poblacional y el
estimador robusto de
0
regresión medio
20 30 40 50 60 70 80
biponderado.
Edad
Línea continua: ajuste mediante el estimador robusto de regresión medio biponderado ▼
Línea de trazos discontinuos: ajuste mediante mínimos cuadrados
La realización de cualquiera
de estas estimaciones
requiere un programa
estadístico apropiado. Entre
TABLA ellos puede utilizarse el
Resultados para drados. El valor extremo apenas afecta a la
9 regresión lineal
estimación robusta.
programa R.
Ramalle-Gómara E, et al.
INVESTIGACIÓN Utilización de métodos robustos en la estadística inferencial
9. Porta M, Moreno V, Sanz F, Carné X. Una 13. García A. Métodos avanzados de estadística
cuestión de poder. Med Clin (Barc) 1989; aplicada. Madrid: UNED, 2001.
92:223-8. 14. Altman DG. Practical statistics for medical
10. Brick JM, Kalton G. Handling missing data research. London: Chapman and Hall, 1991.
in survey research. Stat Methods Med Res 15. García M, Martín M. La media ± la desvia-
1996;5:215-38. ción típica no siempre funciona. Jano 1996;
11. Little RJ. Methods for handling missing va- 50:1508.
lues in clinical trials. J Rheumatol 1999;26: 16. García A. Métodos avanzados en estadística
1654-6. aplicada II. Métodos robustos y de remues-
12. Katz MH. Multivariable analysis: a practical treo. Madrid; 2001.
guide for clinicians. Cambridge: Cambridge 17. Disponible en: http://www.R-project.org/.
University Press, 1999. 2002