Está en la página 1de 16

INSTITUTO TECNOLGICO DE REYNOSA

SOFTWARE ESTADSTICO
EQUIPO NO. 10

DOCENTE: ING. ANA MARITZA RAMREZ GOVEA. MATERIA: ESTADSTICA INFERENCIAL ITURNO: MATUTINO. CARRERA: INGENIERA INDUSTRIAL. 3 SEMESTRE INTEGRANTES DEL EQUIPO: GARCA SNCHEZ MARIO ALBERTO LOMBARD MONTERO WENDY MARICRUZ RODRGUEZ OLVERA KARLA ABIGAIL TORRES DE LA ROSA SANDRA NOHEM ZERMEO GONZLEZ KARLA YESENIA

A: 28.NOV.2011 CD. REYNOSA, TAMPS.

PRUEBAS NO PARAMTRICAS
Se estudiarn las pruebas NO PARAMTRICAS, las cuales no requieren asumir

normalidad de la poblacin y que en su mayora se basan en el ordenamiento de los datos. Todas las pruebas vistas en este captulo requieren que la poblacin sea continua. El parmetro que se usa para hacer las pruebas estadsticas es la Mediana y no la Media. En MINITAB, para las pruebas no paramtricas se elige la secuencia: Abrir programa. Estadsticas. No Paramtricos.

6. PRUEBA DE KOLMOGOROV-SMIRNOV (KS)


En estadstica, la prueba de Kolmogrov-Smirnov (tambin prueba K-S) es una prueba no paramtrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre s. Conviene tener en cuenta que la prueba Kolmogrov-Smirnov es ms sensible a los valores cercanos a la mediana que a los extremos de la distribucin. La prueba de AndersonDarling proporciona igual sensibilidad con valores extremos. En esta prueba tambin se est interesado en el grado de concordancia entre la distribucin de frecuencia muestral y la distribucin de frecuencia terica, bajo la hiptesis nula de que la distribucin de la muestra es f0(x,q) e interesa probar que no existe diferencia significativa. La prueba trabaja con la funcin de distribucin (distribucin de frecuencia acumulativa). Esta prueba pertenece al campo de la Estadstica No Paramtrica. Sea F0(x) la funcin de distribucin terica para la variable aleatoria X, y representa la probabilidad de que la variable aleatoria X tome un valor menor o igual a x (tambin se interpreta como la proporcin esperada de observaciones que tengan un valor menor o igual a x). Es decir: Sea Sn (x) la funcin de distribucin emprica, calculada con base en los valores observados de la muestra n observaciones. Sn (x) representa la proporcin de valores observados que son menores o iguales a x, y est definida como: Sn (x) = P ( X x/ dados los resultados muestrales) = m/n donde m es el nmero de valores observados que son menores o iguales a x.

PASOS A SEGUIR EN MINITAB:


1.-Generaremos 100 datos aleatorios con una Media= 264.6 y una Desviacin Estndar de 32.02, de la siguiente manera: Calc Datos Aleatorios Normal Damos doble clic.

Rellenamos la pantalla con los datos que nos proporcionaron en el problema, como se observa en la imagen, y damos un clic ms en aceptar.

Aparecern 100 datos en la columna [Distribucin Normal].

C1

Nos aseguramos que los datos se distribuyan normalmente con la prueba de KolmogorovSmirnov como sigue. Estadsticas Estadsticas Bsicas Prueba de Normalidad Rellenamos los datos que nos piden: en variable seleccionamos C1 y ah en donde dice prueba de normalidad seleccionamos Kolmogorov-Smirnov. Presionamos Aceptar.

De ah les aparecer el grafico donde se observa la distribucin de los datos.

El VALOR P > 0.05 para que los datos se distribuyan normalmente. Y como se puede observar en el grafico el Valor P > 0.100, lo que nos indica que los datos si se distribuyen normalmente y por lo tanto Aceptamos H y rechazamos H.

PRUEBA DE ANDERSON-DARLIN
La prueba Anderson-Darling es, en general, ms potente que la pruebas X2 de Pearson y la de Kolmogorov-Smirnov . Resulta lgico pensar que la X2 de Pearson es menos potente que la de Kolmogorov-Smirnov y la de Anderson- Darling debido a que trabaja con datos agrupados debido al agrupamiento. Hay prdida de informacin. Por otro lado, la prueba KolmogorovSmirnov es menos sensible a desajustes que pudieran haber en las colas de la distribucin, que la prueba Anderson- Darling (Easterling 1976; Stephens 1974, Cap 4). En particular, la prueba Anderson- Darling funciona mejor que cualquiera otra, cuando haya casos extraordinarios o aberrantes (outliers). La estadstica Anderson-Darling est dada por la siguiente expresin: A 2 =-n- (1/n)[(2i - 1) Ln(P ( i ) ) + (2n +1 - 2i)Ln{1 - p ( i ) }] Donde P(i) es el rea bajo la curva normal para el intervalo (-oo,z( i ) ), o sea es la funcin distribucin normal estndar evaluada en el i-simo elemento (en orden ascendente) de la muestra. Se presentan dos situaciones para la estadstica Anderson-Darling: la primera en que se conocen los parmetros de la distribucin llamado caso 0 (cero), y la otra en que se desconoce al menos uno de ellos (casos 1, 2 y 3). Situndonos en el caso de bondad de ajuste a la distribucin normal se consideran los siguientes casos: Caso 0: y s2 conocidos. Caso 1: s2 conocida y desconocida y estimada por X. Caso 2: conocida y s2 desconocida y estimada por s(n) = (x i - )2 /n Caso 3: ambos desconocidos, estimados por X y sn-1 = (x i- x)2 /n-1 Para cada uno de los casos existe una tabla estadstica para realizar la prueba de la hiptesis, Ho: "La muestra aleatoria proviene de una distribucin normal". La estadstica de Anderson-Darling se calcula para los cuatro casos de la misma manera; sin embargo, en el caso 3 se debe multiplicar por un factor de correccin el cual es: 1 + (0.75/n) + (2.25/n 2), que mejora la aproximacin. La prueba Anderson-Darling para la bondad de ajuste normal, en el caso 0, se realiza siguiendo los siguientes pasos:

Supongamos que tenemos 40 pesos en libras de estudiantes varones. Provienen estos datos d una distribucin normal? 154 136 144 163 147 135 128 145 164 148 126 138 145 165 149 138 147 176 168 150 132 140 156 173 150 135 152 157 146 142 125 142 158 146 119 135 144 161 140 153

Ho: Los datos se ajustan a un modelo normal. Ha: Los datos no se ajustan a un modelo normal. PASOS A SEGUIR EN MINITAB: Introducimos los 40 datos de los pesos en C1. Estadsticas.

Estadsticas Bsicas. Mostrar Estadsticas descriptivas. Aparecen estadsticas. Estadsticas Bsicas. Prueba de Normalidad.

Rellenamos datos y seleccionamos la prueba de Anderson-Darling. De ah nos aparece el grfico.

El VALOR P > 0.05 para que los datos se distribuyan normalmente. Y como se puede observar en el grafico el Valor P = 0.926, lo que nos indica que los datos si se distribuyen normalmente y por lo tanto Aceptamos H y rechazamos H.

PRUEBA DE RYAN-JOINER
La prueba de Ryan - Joiner es usada para probar si una muestra viene de una distribucin especifica. Esta prueba es una modificacin de la prueba de Kolmogorov-Smirnov donde se le da ms peso a las colas de la distribucin que la prueba de Kolmogorov-Smirnov . En estadstica, la prueba de Ryan - Joiner es una prueba no paramtrica sobre si los datos de una muestra provienen de una distribucin especfica. La frmula para el estadstico determina si los datos (observar que los datos se deben ordenar) vienen de una distribucin con funcin acumulativa F. Formulas: A2 = N S Donde:

El estadstico de la prueba se puede entonces comparar contra las distribuciones del estadstico de prueba (dependiendo que F se utiliza) para determinar el P-valor.

Ejemplo: En el mtodo de Anderson Darling o Ryan Joiner, si el valor de probabilidad P de la prueba es mayor a 0.05, se considera que los datos son normales. Seguir los siguientes pasos: H= Los datos tienen una distribucin normal H= Los datos NO tienen una distribucin normal PASOS A SEGUIR EN MINITAB: 1.-Generaremos 100 datos aleatorios con una Media= 264.6 y una Desviacin Estndar de 32.02, de la siguiente manera: Calc. Datos Aleatorios Normal Damos doble clic.

Rellenamos la pantalla con los datos que nos proporcionaron en el problema, como se observa en la imagen, y damos un clic ms en aceptar.

10

Aparecern 100 datos en la columna C1 [Distribucin Normal].

Nos aseguramos que los datos se distribuyan normalmente con la prueba de Ryan-Joiner como sigue. Estadsticas Estadsticas Bsicas Prueba de Normalidad Rellenamos los datos que nos piden: en variable seleccionamos C1 y ah en donde dice prueba de normalidad seleccionamos Ryan-Joiner. Presionamos Aceptar. De ah les aparecer el grafico donde se observa la distribucin de los datos.

11

Como el de la siguiente imagen:

El VALOR P > 0.05 para que los datos se distribuyan normalmente. Y como se puede observar en el grafico el Valor P > 0.100, lo que nos indica que los datos si se distribuyen normalmente y por lo tanto Aceptamos H y rechazamos H.

Otra opcin por medio de una grfica de probabilidad normal, se tiene: Grfica. Grfica de Probabilidad. Individual. Clic Aceptar. Aparece Grfica de Probabilidad.

12

En la variable seleccionan C1, y luego distribucin dan clic en distribucin normal. Luego Aceptar. Los puntos deben quedar dentro del intervalo de confianza para indicar que es normal la distribucin.

13

PRUEBA DE SHAPPIRO-WILK
En estadstica, el Test de ShapiroWilk, se usa para contrastar la normalidad de un conjunto de datos. Se plantea como hiptesis nula que una muestra x1xn proviene de una poblacin normalmente distribuida. Fue publicado en 1965 por Samuel Shapiro y Martin Wilk. Se considera uno de los test ms potentes para el contraste de normalidad, sobre todo para muestras pequeas. El estadstico del test es:

Donde

x(i) (con el subndice i entre parntesis) es el nmero que ocupa la i-sima posicin en la muestra; = (x1 + ... + xn) / n es la media muestral; las constantes ai se calculan2

Donde

Siendo m1...mn son los valores medios del estadstico ordenado, de variables aleatorias independientes e idnticamente distribuidas, muestreadas de distribuciones normales. V es la matriz de covarianzas de ese estadstico de orden. La hiptesis nula se rechazar si W es demasiado pequeo. Es un contraste de ajuste que se utiliza para comprobar si unos datos determinados (X 1, X2,, Xn) han sido extrados de una poblacin normal. Los parmetros de la distribucin no tienen porqu ser conocidos y est adecuado para muestras pequeas (n<50).Un contraste de ajuste tiene como objetivo comprobar si con base en la informacin suministrada por una muestra se puede aceptar que la poblacin de origen sigue una determinada distribucin de probabilidad, en nuestro caso, la distribucin normal

14

PASOS A SEGUIR EN MINITAB: 1.-Generaremos 25 datos aleatorios con una Media= 152.05 y una Desviacin Estndar de 48.09, de la siguiente manera: Calc Datos Aleatorios Normal Damos doble clic.

Rellenamos la pantalla con los datos que nos proporcionaron en el problema, como se observa en la imagen, y damos un clic ms en aceptar. Aparecern 25 datos en la columna C1. Realizaremos la prueba de Wilcoxon para 1 muestra. Estadsticas. No paramtricas. Wilcoxon de 1 muestra.

Rellenamos los datos que nos piden: en variable seleccionamos C1 y ah en donde dice media de la prueba rellenamos con 152 y damos clic en aceptar. Nos aparece otra ventana

15

Grfica. Grfica de Probabilidad. Individual. Con distribucin normal. Y aparece el grfico.

Mide el ajuste de la muestra a una recta, al dibujarla en papel probabilstico normal. Este tipo de representacin tambin lo proporcionan algunos programas de estadstica, de tal manera que nos permite adems apreciar el ajuste o desajuste de forma visual: En escala probabilstica normal se representa en el eje horizontal, para cada valor observado en nuestros datos, la funcin de distribucin o probabilidad acumulada observada, y en el eje vertical la prevista por el modelo de distribucin normal. Si el ajuste es bueno, los puntos se deben distribuir aproximadamente segn una recta a 45. En la imagen vemos que en este ejemplo existe cierta discrepancia. En cualquier caso siempre es adecuado efectuar una representacin grfica de tipo histograma de los datos, y comparar el valor de la media y la mediana, as como evaluar el coeficiente de asimetra y apuntamiento, adems de llevar a cabo una representacin en escala probabilstica de la distribucin de probabilidad esperada versus observada, como la de la figura.

16

También podría gustarte