Está en la página 1de 3

Estadstica no parametrica

Claudio Bustos
10 de octubre de 2014

Indice
1. M
etodos no param
etricos

Referencias
3
Siegel (1956) se
nala que el desarrollo inicial de las pruebas de hipotesis estadsticas se realiz
o haciendo suposiciones bastante fuertes sobre las poblaciones
y los estadsticos que se obtenan de los datos.
Si hacemos el supuesto que todos los grupos tienen distribuciones iguales ,
lo m
as sencillo es realizar pruebas sobre sus parametros, es decir, sobre aquellos
valores que permiten representar completamente a la distribucion. De aqu el
nombre de estadstica parametrica que adopta este tipo de analisis.
Las pruebas parametricas se basan en la manipulacion aritmetica de las
variables, por lo que s
olo admite el uso de variables numericas.
Por ejemplo, una de los operaciones mas comunes es determinar si dos grupos
difieren entre s en su valor central. Si asumimos que la distribucion de cada
grupo es normal, en lo que pueden diferir solamente es en su esperanza o su
varianza poblacional. C
omo generalmente este u
ltimo valor no es relevante, la
prueba se realizar
a sobre la diferencia de esperanzas entre ambos grupos (H0 :
1 = 2 ) y la la prueba de eleccion sera la t de Student para muestras no
relacionadas. Si la cantidad de grupos es mayor, asumiendo que la distribucion
de cada grupo nuevamente es normal y con varianzas iguales, se puede utilizar
la prueba ANOVA de una va, que tiene por hipotesis nula la igualdad de medias
de los grupos (H0 : 1 = 2 = ... = k )
En aquellos casos donde no se supone normalidad en la distribucion original
de los datos, por medio del Teorema del Lmite Central se puede asumir en
muestras grandes que la distribucion de sus medias sera normal. Esto justifica,
entre otras cosas, el uso de ANOVA sobre grupos con datos no normales, pero
con muestras grandes.
Ahora, si nuestras hip
otesis se relacionan con caractersticas distintas a la esperanza poblacional, contamos con muestras peque
nos o tenemos distribuciones
desconocidas o muy distintas a la normal (lo que suele ocurrir con datos a nivel
ordinal o nominal), no podremos utilizar la estadstica basada en parametros.
Para estos casos, se pueden utilizar los metodos no parametricos.

Wasserman (2006) se
nala que lo fundamental de los metodos no parametricos
es usar datos para inferir algo sobre la poblacion usando la menor cantidad de
supuestos posibles.Siegel (1956) agrega que los metodos no parametricos pueden
ser usados para datos no numericos, a nivel ordinal particularmente, de lo cual
surgen las pruebas basadas en el orden de los datos(ranking tests, en ingles).
Entre los problemas que trata la estadstica no parametrica, se cuenta (Wasserman,
2006):
Estimar la distribuci
on de origen de los datos. Esto es, a partir de los
datos, definir cual es la funcion de probabilidad acumulada de la poblacion.
Tambien se puede estimar la funcion de densidad, pero es mas complejo.
Estimar el valor esperado para una variable X, dada una variable Y , lo
que es conocido como regresion no parametrica
Entre las pruebas no parametricas de hipotesis mas conocidas se encuentran
la prueba Chi-cuadrado y prueba exacta de Fisher, para datos a nivel nominal,
y la correlaci
on de rangos de Spearman, para datos a nivel ordinal.
Siegel (1956) se
nala que para optar entre metodos parametricos y no parametricos, se deben considerar las siguientes dimensiones
1. Poder: En general, si la distribucion de origen de los datos es cercana a una
conocida (la normal, por ejemplo), es mejor usar pruebas parametricas,
ya que presentan mayor poder, es decir, capacidad de rechazar H0 cuando
esta es falsa.
2. Tipo de medici
on: si los datos se encuentran a nivel nominal u ordinal, los
datos no son numericas y no aplica la realizacion de operaciones aritmeticas sobre ellos. Por tanto, si la distribucion no es conocida (por ejemplo,
binomial), s
olo se pueden utilizar metodos no parametricos.

1.

M
etodos no param
etricos

A continuaci
on, se presenta una tabla resumen de los metodos a utilizar,
a partir de Sheskin (2003):
Cuadro 1: Tabla resumen de metodos no parametricos
Nivel de medida
Intervalar (continuo)
Intervalar (continuo)
Ordinal
Nominal
Nominal
Intervalar (continuo)
Intervalar (continuo)
Ordinal
Nominal (dicot
omica)
Nominal (dicot
omica)

Dependencia
Independiente
Independiente
Independiente
Independiente
Independiente
Dependiente
Dependiente
Dependiente
Dependiente
Dependiente

No grupos
2
3+
2
2+
2
2
3+
2
2
3+

Nombre
T. de U de Mann-Whitney
T. de Kruskall-Wallis
T. de Kolmogorov-Smirnov
T. 2 de Independencia
T. Exacto de Fisher
T. de Wilcoxon
T. de Friedman
T. de los signos para m.d
T. de McNemar
T. Q de Cochran

Mecanismo
Ranks (Mediana)
Ranks (Mediana)
CDF
Multinomial
Hipergeom
etrica
Ranks (Mediana)
Ranks?
Binomial
Binomial

Referencia

En las pruebas donde se utilizan los rangos, se asume que hay una distribuci
on continua en la cual los datos pueden ser ordenados, generandose as una
variable ordinal sin repeticiones de categoras. Por tanto, si bien las pruebas
estrictamente s
olo exigen que la medicion sea ordinal, el analisis se vuelve mas
complejo si se repiten los valores, lo que se producira si se tiene una variable
ordinal con pocas categoras.
Para analizar variables ordinales con pocas categoras, se aceptan como procedimientos v
alidos el test de Wilcoxon-Mann-Whitney con uniones(ties) o pruebas de permutaci
on(Heeren y DAgostino, 1987). Es necesario, al usar software
estadstico, estar seguro que se calcula el estadstico correcto. En todo caso, si
las categoras son pocas, es recomendable utilizar las pruebas para niveles nominales, como X 2 de Independencia o exacta de Fisher, que aparte tienen la
ventaja de descubrir diferencias en la distribucion que vayan mas alla del punto
central, como la mediana.

Referencias
Heeren, T., y DAgostino, R. (1987). Robustness of the Two Independent
Samples t-Test when applied to ordinal scaled data. Statistics in medicine,
6 , 7990.
Sheskin, D. (2003). Handbook of Parametric and Nonparametric Statistical Procedures. Bora Raton, Florida, EEUU: Chapman and Hall/CRC. Descargado de http://www.crcnetbase.com/doi/book/10.1201/9781420036268
doi: 10.1201/9781420036268
Siegel, S. (1956). Nonparametric statistics. The American Statistician, 11 ,
13-19.
Wasserman, L. (2006). All of nonparametric statistics. Springer.

También podría gustarte