Está en la página 1de 2

Test de hipótesis No Paramétricos

Los test no paramétricos son métodos estadísticos que se aplican cuando se


trabaja con variables aleatorias cualitativas (es decir, aquellas que se refieren a
características o cualidades que no pueden ser medidas con números), categorizadas
o son cuantitativas pero no se conoce su distribución. (Un ejemplo pueden ser las
encuestas políticas, de opinión, de marketing, trabajos de sociología o psicología, etc.)
Tambien en el trabajo con variables de conteo univariadas o bivariadas (como por
ejemplo las tablas de contingencia, en las que se resume el conteo de casos por
categoría de cada variable en el anáisis bivariado, i.e. cuando tenemos dos variables
aleatorias X e Y.
Dentro de estos test no paramétricos tenemos el contraste de la bondad de un ajuste.
El problema de bondad de ajuste consiste en determinar a partir de un conjunto de
datos muestrales si estos son consistentes con una distribución de probalidad dada.

“Partiendo de una muestra de n valores observados, x 1 , , x 2 , … , x n de una r.v. X


(variable aleatoria) con distribución supuesta F(x), se plantea el siguiente contraste de
hipótesis:

H 0 ( hipótesis nula ) : r . v . X → F(x )

H a ( hipótesis alternativa ) :r . v . X sigue otradistribución


Supongamos una cierta distribución teórica para X cuyos parámetros poblacionales los
estimamos a partir de los datos muestrales.

Si denotamos por pi la probabilidad asociada a la clase i, los valores n pi serán los


valores esperados asociados a cada clase i.

Frecuencia
Marca de Probabilidad Valores
Clases Absoluta
Clase teórica Esperados
empírica
1 x1 n1 p1 n p1
2 x2 n2 p2 n p2
… … … … …
i xi ni pi n pi
… … … … …
k xk nk pk n pk
n 1 n

Si algun valor esperado es menor que 5, n pi<5, dicha clase se agrupará con otras
contiguas, de manera que en todas ellas dichos valores sean mayores o iguales a 5,
reduciendose el número de clases.
Estadístico de contraste:
k 2
( ni−np i) 2
Y =∑ → χ k−1−r
i=1 n pi
Este básicamente mide la discrepancia entre la distribución analizada y la esperada
para luego compararla con un valor crítico y ahí tomar la decisión de rechazo o no de
H 0.

Criterio de Rechazo: Y exp ≥ χ 2α ,k−1−r

Donde:
r es el número de parámetros estimados de los que depende la distribución teórica.
k es el número de clases.
α es el nivel de significancia
siendo k−1−r los grados de libertad o df
Regla de decisión: comparamos el estadístico de contraste con el valor teórico crítico
2
tabular χ df ,α y decidimos rechazar o no rechazar H 0 según donde see ubique el
estadístico.

El nivel de significación α es unn umbral que permite determinar si el resultado de un


estudio se puede considerar estadísticamente significativo despues de realizar las
pruebas estadísticas planificadas.
Cuando se toma la decisión de Rechazar o no la hipótesis nula podemos acertar o
cometer errores. En el trabajo real no sabemos que ocurre por que no sabemos si la
hipotesis nula es verdadera o falsa. Sin embargo, dados ciertos supuestos podemos
obtener las probabilidades de cometer errores de tipo I y tipo II.

La probabilidad de cometer errores Tipo I, que simboliza α , es la probabilidad de


ocurrencia de los valores del estadístico en la región de rechazo cuando la hipótesis
nula es verdadera. El valor de α , también denominado nivel de significación, es
definido por el investigador antes de recoger los datos, y la costumbre es hacer
α =0.05 o α=0.01. La probabilidad de cometer errores Tipo II se simboliza β y depende
de varias circunstancias como la distancia que separa el valor asignado al parámetros
en la H 0 de su valor real, el tamaño muestral y el valor asignado a α .

También podría gustarte