Está en la página 1de 4

Prueba de Kolmogorov-Smirnov para una muestra

Raymundo

La prueba de Kolmogorov-Smirnov para una muestra se considera un procedimiento de "bondad de ajuste", es decir, permite medir el grado de concordancia existente entre la distribucin de un conjunto de datos y una distribucin terica especfica. Su objetivo es sealar si los datos provienen de una poblacin que tiene la distribucin terica especificada. Mediante la prueba se compara la distribucin acumulada de las frecuencias tericas (ft) con la distribucin acumulada de las frecuencias observadas (f obs), se encuentra el punto de divergencia mxima y se determina qu probabilidad existe de que una diferencia de esa magnitud se deba al azar. En las tareas de investigacin se pudo obtener un conjunto de observaciones, en las cuales se supone que tienen una distribucin normal, binomial, de Poisson, etc. Para el caso, las frecuencias de las distribuciones tericas deben contrastar con las frecuencias observadas, a fin de conocer cul distribucin se adecua mejor al modelo. Pasos: 1. Calcular las frecuencias esperadas de la distribucin terica especfica por considerar para determinado nmero de clases, en un arreglo de rangos de menor a mayor. 2. 3. 4. 5. 6. Arreglar estos valores tericos en frecuencias acumuladas. Arreglar acumulativamente las frecuencias observadas. Aplicar la ecuacin D = ft - f obs, donde D es la mxima discrepancia de ambas. Comparar el valor estadstico D de Kolmogorov-Smirnov en la tabla de valores crticos de D. Decidir si se acepta o rechaza la hiptesis.

Ecuacin:

D = ft - fobs
En esta ecuacin se aprecia que el procedimiento es muy simple y quiz lo que parezca ms complicado corresponde al clculo de la frecuencia esperada de cada tipo de distribucin terica. Por lo tanto, en la marcha de los ejercicios se presentar cada uno de ellos y la manera de aplicar la prueba estadstica.

Ejemplo:

En una investigacin, consistente en medir la talla de 100 nios de 5 aos de edad, se desea saber si las observaciones provienen de una poblacin normal. Eleccin de la prueba estadstica. El modelo experimental tiene una muestra y es factible un arreglo en el carcter ordinal o en los rangos de las series de clases. Vase: Estadstica/Flujogramas/Flujograma 1

Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Los valores observados de las frecuencias para cada clase son diferentes de las frecuencias tericas de una distribucin normal.

Hiptesis nula (Ho). Las diferencias entre los valores observados y los tericos de la distribucin normal se deben al azar.

Nivel de significacin. Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho. Zona de rechazo. Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha. Tabla de 100 nios. Los valores X + son 99.2 2.85.

Aplicacin de la prueba estadstica. Primero se elaboran los clculos de los valores tericos esperados para la distribucin normal. Inicialmente se determina el valor Z de los lmites de cada clase en la serie, por ejemplo: en la primera clase se determinan el lmite inferior y el superior (90 y 93), y en las subsecuentes slo los lmites superiores (97, 101, 105 y 109). Para cada valor de Z, se localiza el rea bajo la curva norma tipificada. (Vase: tabla de reas bajo la curva normal tipificada de 0 a 2). Los clculos de valores Z, son de la forma siguiente:

Y as sucesivamente. Para cada valor Z, se localiza el rea de la curva tipificada de la tabla de nmeros aleatorios. A partir de estos valores, se obtiene la diferencia entre los lmites de clases entre el superior y el inferior, por ejemplo: 0.4997 0.4793 = 0.020, 0.4793 - 0.2357 = 0.2436, 0.2357 - (-0.2794) = 0.5151, -0.2794 - (-0.4854) = 0.206 y -0.4854 (-0.4994) = 0.014. Estos resultados de diferencias se multiplican por el tamao de la muestra (100 nios), luego se obtienen las frecuencias tericas y despus se arreglan en frecuencias acumuladas. Clculos de los valores tericos.

Las frecuencias acumuladas tericas y las observadas se arreglan en los rangos correspondientes, como se muestra en la siguiente tabla, y posteriormente se aplica la frmula de Kolmogorov-Smirnov. Clculo estadstico D de Kolmogorov-Smirnov.

D = ft - fobs = - 0.036 La diferencia mxima D es igual a -0.049, valor que se compara con los valores crticos de D en la prueba muestral de Kolmogorov-Smirnov y se obtiene la probabilidad de la existencia de esa magnitud de acuerdo con la prueba de Kolmogorov-Smirnov. El valor N es 100 y el mayor nmero de N en la tabla es 35, por lo cual se aplica la frmula al pie de la tabla:

Para la probabilidad de

Lo anterior quiere decir que para todo valor menor que el crtico para una probabilidad de 0.05, la probabilidad correspondiente es mayor que 0.05, y todo valor mayor que D al calculado tinen una probabilidad menor que 0.05, o sea, es inversamente proporcional al crtico determinado o localizado en la tabla. Decisin. En virtud de lo anterior, el estadstico de Kolmogorov-Smirnov obtendo es menor que el crtico y su probabilidad mayor que 0.05, por lo tanto, se acepta Ho y se rechaza Ha. Interpretacin. Las frecuencias observadas y las tericas calculadas no difieren significativamente. Por lo tanto, las observaciones tienen una distribucin normal.