Empates. Los metodos que hemos visto requieren la hipotesis de continui-
dad absoluta en la distribucion de las variables aleatorias observadas. Por lo tanto, no contemplan la posibilidad de que haya empates entre datos, lo cual es relevante especialmente en aquellos que se basan en rangos. En la practica si el numero de empates es peque~no lo que se suele hacer es asignar a los datos empatados el rango promedio que tendran si no hubiese habido empate (guardando siempre el orden con respecto a las restantes observaciones). De todos modos, existen ver- siones de los estadsticos que permiten empates entre observaciones y formas de hacer inferencia exacta en estas circunstancias. Ver Gibbons (1993a) y Gibbons (1993b), por ejemplo. Correccion por continuidad. En las aproximaciones asintoticas de las dis- tribuciones de estadsticos que solo toman valores naturales es conve- niente hacer siempre la correccion por continuidad. Intervalos de conanza. Solo hemos visto procedimientos no parametri- cos clasicos para contrastar hipotesis. La mayora de ellos pueden modi- carse para dar intervalos de conanza para los parametros de interes: mediana, diferencia de mediandas o coeciente poblacional. Por ejem- plo, un test bilateral para la mediana puede usarse para dar un intervalo de conanza para esta, deniendolo como IC(1)(M) = fm 2 R : no se rechaza H0 : M = m a nivel g: Ver Gibbons (1993a) y Gibbons (1993b), por ejemplo. 26 CAPITULO 1. CONTRASTES NO PARAMETRICOS CL ASICOS Comparaciones multiples de las medianas de mas de dos poblaciones. Cuando se rechaza la hipotesis nula de igualdad de medianas en k 3 subpoblaciones, siempre es interesante saber que pares de medianas pueden considerarse iguales y cuales distintas. Se trata pues de hacer simultaneamente k(k 1)=2 contrastes de hipotesis. Estos contrastes individuales se deben hacer a un nivel tal que garantice que la pro- babilidad de error de Tipo I global (probabilidad de rechazar al menos una hipotesis de igualdad entre dos medianas, cuando la hipotesis nula de igualdad entre todas ellas es cierta) sea igual al nivel deseado. En Gibbons (1993b) puede verse como adaptar los contrastes de Kruskal- Wallis y de Friedman para realizar comparaciones multiples entre cada par de medianas. Robustez. Se dice que un procedimento estadstico es robusto frente a la presencia de observaciones atpicas si el resultado obtenido a partir de una muestra no puede ser modicado arbitrariamente mediante la con- taminacion de la muestra con una proporcion peque~na de datos atpicos. Por ejemplo, la media muestral no es robusta, porque alterando un uni- co dato xi de forma que se le haga tender a innito, podemos hacer que la media muestral vaya tambien a innito. Por contra, la mediana es robusta porque aunque se modicase la mitad menos uno de los datos no conseguiramos que el valor de la mediana se alejase innitamente del valor inicial. Los procedimientos estadsticos basados en el calculo de momentos (me- dias, varianza, etc.) suelen presentar problemas de falta de robustez frente a datos atpicos. En cambio, los procedimientos que trabajan con los rangos de las observaciones son robustos. En este sentido los contrastes no parametricos que hemos estudiado son mas robustos que los correspondientes contrastes parametricos. Eciencia relativa. La eciencia relativa asintotica de un procedimiento de contraste A frente a otro B es el cociente del tama~no muestral que requiere el test B entre el que requiere el test A para obtener ambos contrastes la misma potencia, cuando ambos trabajan al mismo nivel de signicacion, las hipotesis sobre las distribuciones son las mismas y los tama~nos muestrales son grandes. Por ejemplo, la eciencia relativa asintotica del test del signo frente al test basado en la t de Student es de 0.67 para la distribucion normal. Eso signica que el test del signo basado en una muestra de una distribucion normal de tama~no 100, por ejemplo, es tan eciente como el test de la t de Student basado en una de tama~no 67. 1.7. COMENTARIOS FINALES 27 La Tabla 1.1 recoge la informacion sobre eciencia relativa de los con- trastes no parametricos que hemos estudiado frente a sus competidores parametricos. Usos de los metodos de suavizado. Analisis exploratorio de datos. Permiten obtener gracos de la funcion de densidad, la funcion de regresion, la funcion de riesgo o sus deri- vadas (entre otras). En analisis multivariante permiten tener versiones no lineales y no parametricas de las componentes principales (curvas principales).
El histograma no es un estimador suave de la funcion de densidad: es
discontinuo y constante a intervalos. 5. La anchura de las cajas b tiene una inuencia importantsima en el comportamiento del histograma como estimador de la funcion de den- sidad (ademas de la ya mencionada inuencia en su aspecto), que puede resumirse como sigue: Si b es peque~no, el histograma tiene poco sesgo y mucha varianza. Si b es grande, el histograma tiene mucho sesgo y poca varianza.