Está en la página 1de 15

Prueba de

Kolmogorov-Smirnov

Estadistica Inferencial 1.

Alvarez Barrientos Thania Gabriela.


Avila Hernandez Juan Jose.
Andréi Nikoláievich Kolmogorov

 (Tambov, 1903 - Moscú, 1987) Matemático soviético


que formuló una definición axiomática de la
probabilidad, y que con sus estudios contribuyó a la
creación de la teoría de la probabilidad. Completó su
formación superior en Moscú, y cuando terminó sus
estudios obtuvo una plaza como profesor de
matemáticas en la universidad de esa misma ciudad.
Que es?

 La prueba de Kolmogorov es una prueba de bondad de ajuste, es


decir, del grado en que la distribución observada difiere de otra
distribución.
 (también prueba K-S) es una prueba no paramétrica que determina la bondad de ajuste
de dos distribuciones de probabilidad entre sí.
 Compara la función de distribución acumulada observada de una variable con una
distribución teórica determinada, que puede ser la normal, la uniforme, la de Poisson o
la exponencial.  
 Es una alternativa a la prueba Ji Cuadrado de bondad de ajuste
cuanto el número de datos es pequeño.
Para que sirve?
 Sirve para verificar o negar la hipótesis que un conjunto de observaciones provienen de
una distribución.
 La estadística D que se utiliza en esta prueba es una medida de la diferencia máxima
observada entre la distribución empírica y la teórica supuesta.
 D es una variable aleatoria. Se utiliza esta prueba para verificar o negar que un
conjunto de números pseudoaleatorios tienen una distribución uniforme en el intervalo
cerrado [0,1].
Pruebas no paramétricas

 La prueba de Kolmogórov-Smirnov es un tipo de prueba no paramétrica. Las


pruebas no paramétricas (también llamadas de distribución libre) son utilizadas en
estadística inferencial, y tienen las siguientes características:
• Plantean hipótesis sobre bondad de ajuste, independencia...
• El nivel de medida de las variables es bajo (ordinal).
• No tienen excesivas restricciones.
• Son aplicables a muestras pequeñas.
• Son robustas.
Formula

 El estadístico Kolmogorov-Smirnov,  D, considera la desviación de la función de


distribución de probabilidades de la muestra P(x) de la función de probabilidades
teórica, escogida Po(x) tal que:


  Dn = max | P(x) – Po(x) |
 La prueba requiere que el valor Dn calculado con la expresión anterior sea menor que
el valor tabulado Dα para un nivel de significancia (o nivel de probabilidad) requerido.
El valor crítico Dα de la prueba se obtiene de la tabla mostrada, en función del nivel de
significancia α y el tamaño de la muestra n.
El procedimiento a seguir en la aplicación práctica de la prueba de Kolmogorov-
Smirnov es el siguiente:

1. Determinar la frecuencia observada acumulada y la frecuencia téorica acumulada, Po(x)


y P(x).
2. En cada caso, calcular: Dn = max | P(x) – Po(x) |
Así, Dn es la máxima diferencia entre la función de distribución acumulada de la
muestra y la función de distribución acumulada teórica escogida
 Fijar un nivel de probabilidad o de significancia α. Los valores de 0.05 y 0.01 son los más
usuales.
3. Determinar el valor crítico Dα en la tabla correspondiente.
4. Aplica el criterio de decisión:
• Si el valor calculado Dn es menor que el Dα, se acepta la hipótesis nula (Ho) que establece que
la serie de datos se ajusta a la distribución teórica escogida.
• Si el valor calculado Dn es mayor que el Dα, se rechaza la hipótesis nula (Ho) y se acepta la
hipótesis alternativa (Ha) que establece que la serie de datos no se ajusta a la distribución
teórica escogida.
Tabla
Kolmogorov-
smirnov.
Se ha realizado una muestra a 178 municipios al respecto del porcentaje de
población activa dedicada a la venta de ordenadores resultando los siguientes
valores :
porcentaje nº de municipios
menos del 5% 18
entre el 5 y 10 % 14
entre 10 y 15% 13 Queremos contrastar que el porcentaje de
municipios para cada grupo establecido se
entre 15 y 20% 16
distribuye uniformemente con un nivel de
entre 20 y 25 % 18 significación del 5%.
entre 25 y 30 % 17 Bajo la hipótesis nula cada grupo debiera de
entre 30 y 35 % 19 estar compuesto por el 10% de la población
dado que existen diez grupos . Así podemos
entre 35 y 40 % 24
establecer la tabla (PE)
entre 40 y 45 % 21
mas de 45% 18
grupos     n0,i F0(xi) nt,i=n·P(xi) F0(xi)
-variable
menos del 5% 18 18/178=0,1011 17.8 17.8/178=0,1 0.0011

entre el 5y10 % 14 32/178=0,1798 17.8 35.6/178=02 0,0202

entre 10 y 15% 13 0,2584 17.8 0,3 0,0416

entre 15 y 20% 16 0,3427 17.8 0,4 0,0573

entre 20 y 25 % 18 0,4439 17.8 0,5 0,0561

entre 25 y 30 % 17 0,5393 17.8 0,6  


0,0607 max
entre 30 y 35 % 19 0,6461 17.8 0,7 0,0539

entre 35 y 40 % 24 0,7809 17.8 0,8 0,0191

entre 40 y 45 % 21 0,8989 17.8 0,9 0,0011

mas de 45% 18 1 17.8 1 0


 Siendo la máxima diferencia =0,0607 y por tanto el
estadístico de K-S que compararemos con el establecido en la tabla que será
para un nivel de significación de 5% y una muestra de 178
dado que el estadístico es menor (0,0607) que
el valor de la tabla (0,1019) no rechazamos la hipótesis de comportamiento
uniforme de los grupos establecidos al respecto de la población activa
dedicada a la venta de ordenadores.

También podría gustarte