Está en la página 1de 17

15

MANUAL PARA PRCTICA DE KOLMOGOROV-SMIRNOV


OBJETIVO
Utilizar programas por medio de sus frmulas y aplicaciones, para probar una distribucin
normal de una serie de datos dados de la distribucin de una poblacin.
Llegar a la solucin de una manera eficiente y con capacidad de seguirla por cuenta propia a
la hora de elaborar una prctica parecida a la mostrado o en su caso diferente.
Tomar nuestras propias conclusiones despus de haber elaborado la prctica y hacer una
comparacin con resultados manuales.

INTRODUCCION
Prueba de hiptesis de una muestra para determinar si la poblacin de la cual extrajo su
muestra es no normal. Muchos procedimientos estadsticos dependen de la normalidad de
la poblacin, de modo que recurrir a una prueba de normalidad para determinar si se
rechaza este supuesto pudiera ser un paso importante en su anlisis. La hiptesis nula
para una prueba de normalidad establece que la poblacin es normal. La hiptesis
alternativa establece que la poblacin es no normal.
La prueba de Kolmogorov-Smirnov para una muestra se considera un procedimiento de
"bondad de ajuste", es decir, permite medir el grado de concordancia existente entre la
distribucin de un conjunto de datos y una distribucin terica especfica. Su objetivo es
sealar si los datos provienen de una poblacin que tiene la distribucin terica
especificada.
Mediante la prueba se compara la distribucin acumulada de las frecuencias tericas (ft)
con la distribucin acumulada de las frecuencias observadas (f obs), se encuentra el
punto de divergencia mxima y se determina qu probabilidad existe de que una
diferencia de esa magnitud se deba al azar.
Pasos:
1. Calcular las frecuencias esperadas de la distribucin terica especfica por
considerar para determinado nmero de clases, en un arreglo de rangos de menor a
mayor.
2. Arreglar estos valores tericos en frecuencias acumuladas.
3. Arreglar acumulativamente las frecuencias observadas.
4. Aplicar la ecuacin D = ft - f obs, donde D es la mxima discrepancia de ambas.
5. Comparar el valor estadstico D de Kolmogorov-Smirnov en la tabla de valores
crticos de D.
6. Decidir si se acepta o rechaza la hiptesis.
Ecuacin:

D = ft fobs?

16

Veamos la forma de realizar un ejercicio mediante un programa, en primera opcin se


encuentra la hoja de clculo de Microsoft Excel, que es la forma ms parecida a
elaborarse de forma manual
EJERCICIO 1
Se han simulado 100 observaciones de una mquina de llenado de
gaseosas, con una media de 100 y desviacin estandar de 0.35.
Determinar si los datos siguen una distribucin normal de acuerdo a
la prueba de bondad de Kolmogorov-Smirnov con un nivel de
significancia de 0.05
DATOS OBTENIDOS DEL PROBLEMA
1.- Establecer la hiptesis nula y alternativa
; Los datos siguen una distribucin Normal
; Los datos no siguen una distribucin Normal
2.- Seleccionar el nivel de confianza
= 0.05
3.- Seleccionar y obtener el estadstico de prueba de acuerdo al parmetro que se est
probando, y de acuerdo a su valor crtico definir la regin de aceptacin y de rechazo.
0.4

Densidad

0.3

0.2

Ho

0.1

0.025

0.025
0.0

4.- Tamao de la muestra N=100


5.- Media de la muestra

= 100

6.- Desviacin estndar

= 0.35

17

REALIZACION DE LA PRUEBA
Por medio de estas tablas podemos obtener el resultado de si se acepta Ho o se rechaza
Ho.

Existe evidencia suficiente para pensar que la distribucin no es normal. Se rechaza Ho

18

METODOLOGIA:
1.- Abrimos nuevo Documento en Excel
2.- Capturamos una tabla de las siguientes formas en una misma hoja:

3.-Generemos datos aleatorios con las especificaciones del problema.


Nos dirigimos a: Men Datos > Anlisis de Datos > Generacin de nmeros Aleatorios

19

Aparecer un cuadro de dialogo el cual se llena con los datos previamente mencionados

Nmero de variables
Nmero de Datos
Tipo de distribucin

Media
Desviacin estndar

Donde se colocaran
los datos

Esta nos dar los datos en forma de lista:

20

4.- Nos dirigimos a la primera tabla para comenzar su llenado de datos


(Nota: Lo colocado dentro de algunos parntesis (B3:B102) son el rango de celdas
donde se encuentran los datos)

El #INTERV SE ESCOGE DE LA SIG FORMA:


- SI #DATOS < 100 STURGES
- DE LO CONTRARIO POR RAIZ DE N

5.- Despus de esto nos dirigimos a contestar las columnas de la tabla 2.

En la columna de intervalos es dependiendo del resultado en


#INTERVALOS que se haya tomado en la tabla anterior, en caso
de tomarse un #INTERVALOS con decimales, se utiliza el numero
entero posterior a este. Por ejemplo de haber tomado 16.20, el
nmero de intervalos seria 17.

21

Las columnas de lmite inferior y lmite superior son respectivamente para cada intervalo.
NOTA IMPORTANTE
La parte que sigue es de suma importancia de realizar paso por paso de la forma
como se explica, en caso contrario el resultado no ser el deseado.

Se sealan las celdas en las cuales requeridas por el nmero de


intervalos

Se coloca la frmula que corresponde


a la frecuencia, los nmeros en azul
corresponden a todos los datos del
problema, y los nmeros verdes
corresponden a todos los lmites
superiores de los intervalos.

22

Al concluir la formula presionamos el conjunto de


teclas (Ctrl + Shift + Enter) y obtenemos la frecuencia
observada de cada intervalo, el cual es el nmero de
datos del problema que se encuentran dentro de esos
lmites respectivamente.

Posteriormente se realiza la suma de todas las frecuencias para


corroborar que el nmero total de datos se encuentra dentro de estos
rangos.

Con la frecuencia observada podemos elaborar una grfica en la cual muestre de esta manera si se
aproxima a ser normal o no lo es. Esto se realiza de la siguiente forma.

Sealamos todos los datos de frecuencia observada, nos dirigimos a:


Men Insertar > Grficos columna

23

Y as de esta manera se obtiene una grfica de la frecuencia observada.

Ahora seguimos con la columna de Frecuencia observada relativa, la cual es el porcentaje en


frecuencia respecto al total de datos de la prctica.

24

La frecuencia esperada relativa, como su nombre lo dice es una frecuencia que se espera
obtener, mas no es exactamente la obtenida. Para sacar estos resultados esperados,
realizamos en la columna las siguientes operaciones.

Cuando:
X Lmite inferior del intervalo
Media Media del problema
Desv_estndar Desviacin estndar del problema
Acum Si deseamos que se acumule colocamos VERDADERO

La columna de ABS simboliza valor absoluto, la cual son para obtener los estadsticos de
Kolmogorov-Smirnov, estos se obtienen de la siguiente forma.

25

6.-Al concluir esta tabla nos dirigimos a concluir la prctica con la ltima tabla.

Nota: La frmula de la estimacin por tabla se obtiene de la siguiente.

Existe evidencia suficiente para pensar que la distribucin no es normal. Se rechaza Ho

26

Veamos ahora la forma de realizar un ejercicio mediante la segunda opcin que se


encuentra en la hoja de clculo de IBM SPSS Statistics, que es una forma un poco ms
rpida a la previamente elaborada en Microsoft Excel.
EJERCICIO 2
Las tallas, medida en metros de nueve peces espada capturados
por un palangrero fueron:
1.628, 1.352, 1.800, 1.420, 1.594, 2.132, 1.614, 1.924, 1.692
Con un nivel de significancia de 0.05. Comprobar si los datos
siguen una distribucin normal.

DATOS OBTENIDOS DEL PROBLEMA


1.- Establecer la hiptesis nula y alternativa
; Los datos siguen una distribucin Normal
; Los datos no siguen una distribucin Normal
2.- Seleccionar el nivel de confianza
= 0.05
3.- Seleccionar y obtener el estadstico de prueba de acuerdo al parmetro que se est
probando, y de acuerdo a su valor crtico definir la regin de aceptacin y de rechazo.
0.4

Densidad

0.3

0.2

Ho

0.1

0.025

0.025
0.0

4.- Tamao de la muestra N=9


5.- Media de la muestra

= 1.684

6.- Desviacin estndar

= 0.241837

27

REALIZACION DE LA PRUEBA
Por medio de estas tablas podemos obtener el resultado de si se acepta Ho o se rechaza
Ho.
Estas tablas fueron obtenidas del programa IBM SPSS Statistics.

Existe evidencia suficiente para pensar que la distribucin no es normal. Se rechaza


Ho

28

METODOLOGIA:
1.- Abrimos nuevo Documento en IBM SPSS Statistics.
2.- Capturamos los datos dados en una nueva columna como la siguiente.
Para el llenado de la columna tenemos que darle seguimiento
a estos pasos:
Seleccionamos la columna a llenar y damos doble clic
en el ttulo de la columna (var en este caso)

Nos aparecer una columna a la cual tenemos que


llenar como en el ejemplo siguiente:

3.- Regresamos a la parte de las columnas para el llenado de los datos, para regresar a
este nos vamos a la parte de abajo de la ventana y encontramos un par de botones,
damos clic en vista de datos para regresar a las columnas.

4.- Llenamos los datos que el ejercicio nos da en la columna que creamos.

29

5.- Ahora para hacer el procedimiento para comprobar mediante Kolmogorov-Smirnov nos
dirigimos a: Men Analizar > Pruebas no paramtricas > Cuadro de dialogo antiguo > K-S
de 1 muestra y damos clic.
Como se muestra en la siguiente imagen.

6.- Posteriormente nos aparecer una ventana emergente la cual hay que completar de la
siguiente forma

30

Dentro de este cuadro de dialogo existe el botn de Opciones el cual nos permite
modificar, quitar o agregar en el resultado de este. Aqu se muestra.

7.- Para finalizar el proceso solo basta en darle aceptar y nos mostrara el resultado
deseado en una nueva ventana.

31

También podría gustarte