Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Facultad de Ciencias
Departamento de Estadística
JPH
APUNTE N°1
MÉTODOS NO PARAMÉTRICOS
𝑖 𝑖−1
𝐷 = máx {| − 𝐹0 (𝑥𝑖 )| , |𝐹0 (𝑥𝑖 ) − |} = máx {𝐷+ , 𝐷− }
1≤𝑖≤𝑛 𝑛 𝑛 1≤𝑖≤𝑛
Donde:
De acuerdo a esto, si esta discrepancia entre el orden de los datos y la probabilidad es pequeña,
generará en consecuencia un D pequeño, por lo tanto, con mayor chance de no-rechazar la
hipótesis nula, y por el contrario, si las diferencias son cada vez mayores, un valor mayor de D hará
eventualmente que la hipótesis nula se rechace.
Si 𝐷 ≤ 𝐷𝛼 , no se rechaza 𝐻0
Si 𝐷 > 𝐷𝛼 , se rechaza 𝐻0
𝐶𝛼
Con 𝐷𝛼 =
𝑘(𝑛)
Los valores de 𝐷𝛼 se obtienen dependiendo de la distribución de probabilidades que se desee
evaluar:
Observación: para generar los datos de 𝐷𝛼 no considera la distribución en particular que se está
evaluando.
Determine si la siguiente muestra de una variable Y {6.0, 2.3, 4,8, 5.6, 4.5, 3.4, 3,3, 1.9, 4,8, 4.5} se
distribuye normal con parámetros 𝜇𝑦 = 4 y 𝜎𝑦2 = 2.1.
Solución:
y y_ORD orden F Z F0 D+ D-
6 1.9 1 0.1 -1.449 0.0736 0.026 0.074
2.3 2.3 2 0.2 -1.173 0.1204 0.080 0.020
4.8 3.3 3 0.3 -0.483 0.3145 -0.015 0.115
5.6 3.4 4 0.4 -0.414 0.3394 0.061 0.039
4.5 4.5 5 0.5 0.345 0.6350 -0.135 0.235
3.4 4.5 6 0.6 0.345 0.6350 -0.035 0.135
3.3 4.8 7 0.7 0.552 0.7095 -0.010 0.110
1.9 4.8 8 0.8 0.552 0.7095 0.090 0.010
4.8 5.6 9 0.9 1.104 0.8652 0.035 0.065
4.5 6 10 1 1.380 0.9162 0.084 0.016
Donde:
𝑛: es el tamaño de la muestra
Este test es una versión modificada del test K-S, otorgando mayor peso a las colas de la distribución
sometida a prueba. A diferencia del test K-S, el test de Anderson-Darling si usa las distribuciones
en particular para calcular los valores críticos de su distribución propia y así poder tomar mejor la
decisión. Ahora para el test de normalidad, podemos distinguir cuatro situaciones:
En primer lugar, los datos de la muestra se deben ordenar de menor a mayor de tal manera de
obtener una secuencia. En segundo lugar, sean
μ, si la media es conocida
𝜇̂ = {
x̅, si la media es desconocida
σ2 , si la varianza es conocida.
𝜎̂ 2 = { Sn2 , si la varianza es desconocida pero la media si
2
Sn-1 , si ambas son desconocidas
Luego, se estandariza generando:
𝑋𝑖 − 𝜇̂
𝑍𝑖 =
𝜎̂
Y el estadístico de prueba para normalidad es dado por:
𝑛
1
𝐴2 = −𝑛 − 𝑆 = −𝑛 − ∑(2𝑖 − 1)[ln Φ(𝑍𝑖 ) + ln(1 − Φ(𝑥𝑛+1−𝑖 ))]
𝑛
𝑖=1
Donde:
𝑛: es el tamaño de la muestra
Sólo para el caso 3, ambos parámetros desconocidos, se calcula el siguiente estadístico modificado:
0.75 2.25
𝐴∗2 = 𝐴2 (1 + + 2 )
𝑛 𝑛
En su libro, Stephens1 (1974) indica que este procedimiento debe ser utilizado cuando 𝑛 ≥ 8. De
acuerdo al método de cálculo, similarmente a K-S, si esta discrepancia entre el orden de los datos
y la probabilidad es pequeña, generará en consecuencia un 𝐴2 o 𝐴∗2 pequeño, por lo tanto, con
mayor chance de no-rechazar la hipótesis nula, y por el contrario, si las diferencias son cada vez
mayores, un valor mayor de 𝐴2 o 𝐴∗2 hará eventualmente que la hipótesis nula se rechace.
Si 𝐷 ≤ 𝐾𝛼 , no se rechaza 𝐻0
Si 𝐷 > 𝐾𝛼 , se rechaza 𝐻0
Los valores de acuerdo a distintos niveles de 𝛼, son los siguientes:
𝛼 𝐾𝛼
0.005 1.159
0.01 1.035
0.025 0.873
0.05 0.752
0.10 0.631
1
Stephens, M. A. (1974). EDF Statistics for Goodness of Fit and Some Comparisons, Journal of the American Statistical
Association, 69, pp. 730-737.
Ejemplo 2.
Determine si la siguiente muestra de una variable X {100.42, 96.20, 98.98, 106.82, 98.70, 84.27, 101.58,
90.87, 92.55, 113.75} se distribuye normal con parámetros 𝜇𝑦 = 100 y 𝜎𝑦2 = 100.
Solución: