Está en la página 1de 2

PRUEBA DE NORMALIDAD

Valor P
Determina si es adecuado rechazar la hipótesis nula en una prueba de hipótesis.  Los valores p abarcan de 0 a 1. El valor p es la
probabilidad de obtener una estadística de prueba que sea por lo menos tan extrema como el valor calculado, si la hipótesis nula es
verdadera. Antes de realizar cualquier análisis, determine su nivel de significancia ( α ). Un valor comúnmente utilizado es 0.05. Si el
valor p de una estadística de prueba es menor que su nivel de significancia, rechace la hipótesis nula.
Debido a lo indispensable de su función en las pruebas de hipótesis, los valores p se utilizan en muchas áreas de la estadística, entre
las que figuran la estadística básica, los modelos lineales, la confiabilidad y los análisis multivariados, entre muchos otros. La clave es
comprender lo que representan las hipótesis nulas y alternativas en cada prueba y luego utilizar el valor p para orientarse en su
decisión de rechazar la nulidad.
Por ejemplo, considere una prueba t de 2 muestras en la que está probando la diferencia entre la medias de la dureza de aceros de dos
proveedores, basándose en muestras de cada uno. En este caso, la hipótesis nula establece que las medias de las dos poblaciones son
iguales, mientras que la hipótesis alternativa establece que no son iguales. Un valor p por debajo de su nivel de corte sugiere que las
medidas de las poblaciones son diferentes.
Suponga que también está efectuando análisis de regresión sobre la dureza del acero, donde la temperatura es una de las variables
explicativas. Verá un valor p para cada coeficiente de regresión. En este contexto, la prueba predeterminada consiste en determinar si
el coeficiente estimado de temperatura es diferente de cero. Por lo tanto, la hipótesis nula establece que el coeficiente es igual a cero,
mientras que la hipótesis alternativa establece que no es igual a cero. Un valor p por debajo de su nivel de corte significa que el
coeficiente de temperatura es significativamente diferente de cero.
El valor p se calcula a partir de la muestra observada y representa la probabilidad de rechazar incorrectamente la hipótesis nula,
cuando en realidad es verdadera (error de tipo I). En otras palabras, es la probabilidad de obtener una diferencia que sea, como
mínimo, tan grande como la diferencia entre el valor observado y el valor hipotético a través del error aleatorio solamente.

  H0: los datos siguen una distribución normal  vs.  H1: los datos no siguen una distribución normal

Ejemplo:
En un motor en funcionamiento, las piezas del árbol de levas suben y bajan. DistAaB es la distancia (en mm) desde la posición real
(A) de un punto en el árbol de levas hasta una posición de línea base (B). Para asegurar la calidad de producción, un gerente tomó
cinco mediciones cada día de trabajo en una planta ensambladora de vehículos, desde el 28 de septiembre hasta el 15 de octubre, y
luego diez mediciones al día desde el 18 al 25 de septiembre.
Usted desea determinar si estos datos siguen una distribución normal, de modo que utiliza una Prueba de normalidad.

1    Abra la hoja de trabajo ÁRBOLLEV.MTW.


2    Elija Estadísticas > Estadísticas básicas > Prueba de normalidad.
3    En Variable, ingrese DistAaB. Haga clic en Aceptar.

Prueba de Anderson-Darling
Esta prueba compara la función de distribución acumulada empírica de los datos de su muestra con la distribución esperada si los
datos son normales. Si esta diferencia observada es suficientemente grande, la prueba rechazará la hipótesis nula de normalidad en la
población.
Prueba de normalidad de Ryan-Joiner
Esta prueba evalúa la normalidad calculando la correlación entre sus datos y las puntuaciones normales de sus datos. Si el coeficiente
de correlación se encuentra cerca de 1, es probable que la población sea normal. La estadística de Ryan-Joiner evalúa la solidez de
esta correlación; si se encuentra por debajo del valor crítico apropiado, usted rechazará la hipótesis nula de normalidad en la
población. Esta prueba es similar a la prueba de normalidad de Shapiro-Wilk.

Prueba de normalidad de Kolmogorov-Smirnov


Esta prueba compara la función de distribución acumulada empírica de los datos de su muestra con la distribución esperada si los
datos son normales. Si esta diferencia observada es suficientemente grande, la prueba rechazará la hipótesis nula de normalidad en la
población.
Si el valor p de esta prueba es menor que su nivel a elegido, usted puede rechazar su hipótesis nula y concluir que la población es no
normal.

Gráfica de probabilidad de DistAaB


Gráfica de probabilidad de DistAaB Normal Prueba de Ryan Joiner - RJ
Normal Prueba de Anderson Darling - AD
99,9
99,9 Media 0,4417
Media 0,4417 Desv.Est. 3,491
99 N 125
Desv.Est. 3,491
99 N 125 RJ 0,990
AD 0,891 95 Valor P 0,066
95 Valor P 0,022 90
90 80
Porcentaje

80 70
Porcentaje

70 60
60 50
50 40
40 30
30 20
20 10
10 5
5
1
1
0,1
0,1 -10 -5 0 5 10
-10 -5 0 5 10 DistAaB
DistAaB

Gráfica de probabilidad de DistAaB


Prueba de Normalidad Kolmogorov Smirnov - KS
Interpretación de los resultados
99,9
Media 0,4417
La salida gráfica es una gráfica de probabilidades normales versus 99
Desv .Est. 3,491
N 125
KS 0,094
los datos. Los datos se alejan de la línea ajustada de una manera 95 Valor P <0,010
90

más evidente en los extremos, o colas de la distribución. El valor p 80


Porcentaje

70
60
de la prueba de Anderson-Darling indica que, en niveles a mayores 50
40
30
que 0.022, hay evidencia de que los datos no siguen una 20
10

distribución normal. Existe una leve tendencia a que los datos sean 5

1
más ligeros en las colas que la distribución normal porque los
0,1
puntos más pequeños se encuentran por debajo de la línea y el -10 -5 0 5 10
DistAaB
punto más grande se encuentra por encima de la línea. Una
distribución con colas pesadas mostraría un patrón opuesto en los extremos.

También podría gustarte