Está en la página 1de 16

1

Universidad Tecnológica De Honduras

Prueba de normalidad de Shapiro - Wilks

Asignatura:

Diseño y Experimentación
Sección lunes a jueves de 11:10 am a 12:00 m

Catedrático:

Ing. Ina Brenda Flores

Presentado por:

Gustavo Adolfo Almendarez Cruz 200810510066


Alexander Albertico Bonilla Zelaya 201810110115
Noé Alexander Cárcamo Mendoza 202010050194
Juan Ramón Leiva 201810050042

Daniela Josselyn Mejía 201710030203

Merelyn Skarleth Caballero Trochez 201910050110

Eduardo José Vallecillo Mejía 201910050021

Ruth Nahary Rodríguez Mejía 201820050009

7 de Marzo de 2023
Índice

Introducción.......................................................................................................................................................... 3
Objetivo General................................................................................................................................................. 4
Objetivos Específicos....................................................................................................................................... 4

MARCO TEORICO
¿Qué es la prueba Shapiro Wilks?………………………………..………………………….5

Tipos de hipótesis a probar……………………………………………………………………9

Ejemplo de Prueba Shapiro Wilks……………………………………………………………11

Conclusiones........................................................................................................................................................ 15
Bibliografía................................................................................................................................................16
Introducción

El test Shapiro-Wilk es una prueba de bondad de ajuste a una distribución normal. Se


aplica bajo determinadas circunstancias y, en líneas generales, nos da información
sobre la idoneidad de realizar los análisis estadísticos bajo pruebas paramétricas o
pruebas no paramétricas. El estadístico Shapiro-Wilk compara la función de
distribución acumulada observada de una variable con una distribución teórica
determinada.

Antes de realizar cualquier análisis estadístico se debe determinar si la muestra se ha


extraído aleatoriamente de una población que siga un modelo de probabilidad ajustado
a la distribución normal. Es decir, si la muestra se distribuye siguiendo la distribución
normal en forma de campana de Gauss.
Objetivo General

Determinar si una muestra aleatoria presenta distribución normal. La lógica de la


prueba se basa en las desviaciones que presentan las estadísticas de orden de
la muestra respecto a los valores esperados de los estadísticos de orden de la
normal estándar.

Objetivos Específicos

Determinar mediante la prueba Shapiro-Wilk si la variable objeto de estudio


procede de una población que se distribuye de manera normal.
Generar gráfica de probabilidad normal y realizar pruebas de hipótesis
Evaluar las afirmaciones del test y aumentar nuestro conocimiento en la
aplicación de las distintas pruebas de Shapiro-Wilk mediante el desarrollo de
problemas prácticos.
¿Qué es la prueba de Shapiro-Wilk?

La prueba de Shapiro-Wilk es una prueba de normalidad. Se utiliza para determinar si


una muestra proviene o no de una distribución normal. Este tipo de prueba es útil para
determinar si un conjunto de datos determinado proviene o no de una distribución
normal, que es una suposición común utilizada en muchas pruebas estadísticas,
incluida regresión, ANOVA, pruebas T y muchas otras.

Fue publicado en 1965 por Samuel Sanford Shapiro y Martin Wilk.

La prueba te da un valor W; los valores pequeños indican que su muestra no tiene una
distribución normal (puede rechazar la hipótesis nula de que su población tiene una
distribución normal si sus valores están por debajo de cierto umbral). La fórmula para
el valor de W es:

El estadístico de prueba utilizado es:

Donde:

X1 : Son los valores de muestra aleatorios ordenados


X : Un vector numérico de valores de datos.
Ai : Son constantes generadas a partir de las covarianzas ,varianzas y medias de la
Muestra (tamaño n) de una muestra normalmente distribuida.

Esta función produce un estadístico de prueba W junto con un valor p correspondiente.


Si el valor p es menor que α = 0.05, hay evidencia suficiente para decir que la muestra
no proviene de una población con distribución normal.
La prueba tiene limitaciones, lo más importante es que la prueba tiene un sesgo por el
tamaño de la muestra. Cuanto más grande sea la muestra, más probable es que
obtenga un resultado estadísticamente significativo.

Es raro que desee calcular el Shapiro-Wilk a mano. Muchos paquetes de software


pueden hacer los cálculos como Minitab.

Interpretación

La hipótesis nula de esta prueba es que la población tiene una distribución normal. Por
lo tanto, si el valor p es menor que el nivel alfa elegido, entonces se rechaza la
hipótesis nula y hay evidencia de que los datos probados no se distribuyen
normalmente. Por otro lado, si el valor p es mayor que el nivel alfa elegido, entonces la
hipótesis nula (que los datos provienen de una población distribuida normalmente) no
puede rechazarse (por ejemplo, para un nivel alfa de 0.05, un conjunto de datos con un
valor de p menor que 0.05 rechaza la hipótesis nula de que los datos provienen de una
población distribuida normalmente).

Prueba Shapiro-Wilk

En primer lugar, debemos conocer la naturaleza de los datos de nuestra muestra ya


que no todo lo que tengamos lo podremos analizar con esta prueba. Al igual que
ocurre con la prueba Kolmogórov-Smirnov (prueba K-S), las variables objeto de estudio
deben de ser de tipo cuantitativo. Sin embargo, a diferencia de la prueba K-S, el
tamaño muestral debe ser igual o inferior a 50 participantes o ítems. En el caso de que
tengamos una muestra mayor que 50 deberemos efectuar la prueba de Kolmogórov-
Smirnov.
Al ser una prueba de significación estadística no paramétrica, se establecen dos
hipótesis que se deberían contrastar:

Hipótesis nula Ho: la muestra procede de una distribución normal. Aceptamos


la H0 siempre y cuando el p-valor de esta prueba estadística sea mayor que

0.050.

Hipótesis alternativa H1: por el contrario, los datos no se distribuyen según un


modelo de probabilidad normal. Aceptamos la H1 cuando el P−valor de la prueba

sea menor que 0.050.

Todo lo visto se puede resumir en la siguiente tabla:

¿Cuál es el objetivo de la prueba de Shapiro-Wilk?

PRUEBA DE SHAPIRO-WILK PARA PROBAR NORMALIDAD

Con objetivo de determinar si una muestra aleatoria presenta distribución normal. La


lógica de la prueba se basa en las desviaciones que presentan las estadísticas de
orden de la muestra respecto a los valores esperados de los estadísticos de orden de
la normal estándar.
¿En que se basa la lógica de la prueba de Shapiro-Wilk?

La lógica de la prueba se basa en las desviaciones que presentan


las estadísticas de orden de la muestra respecto a los valores
esperados de los estadísticos de orden de la normal estándar.

¿Cuándo se usa el test de Shapiro Wilk?

El test de Shapiro-Wilk se usa para contrastar si un conjunto de


datos sigue una distribución normal o no. Este hecho es de vital
importancia porque otros muchos análisis estadísticos requieren de
la normalidad de los datos para poder llevarlos a cabo.

Supuestos puntos para una prueba de Shapiro Wilk de normalidad

1. Una muestra menor a 50 datos

2. Observaciones Independientes
3. Muestreo Aleatorio

4. Variables en escala intervalos o razón

TIPO DE HIPÓTESIS A PROBAR

H o=La muestra aleatoria tiene una distribución normal.

H i=Hipótesis alterna sin dirección.

H i=La muestra aleatoria no tiene una distribución normal.

DISTRIBUCIÓN MUESTRAL

Cuantiles de W.

TIPO DE DATOS

Puntajes individuales.
Donde

An−i+1 =cuantiles esperados de Xi

X n−i +1=dato mayor de la muestra ordenada

X i=dato menor de la muestra ordenada

X =dato de la muestra ordenada

x=media dela muestra

REGLA DE DECISIÓN

Si W O ≤ W T , α = Rechazamos H0

(Tabla cuantiles de W)
EJEMPLO

En un centro de investigación sobre trastornos de la alimentación se


llevó cabo un estudio para probar una nueva terapia en mujeres
anoréxicas. Los efectos benéficos de la intervención se observarían
en el peso ganado (en kg.) por las mujeres al término de tres meses.
El estudio se realizó con una muestra aleatoria de siete mujeres y los
datos obtenidos son los siguientes.

61-48-250

Antes de proceder a analizar los datos con pruebas de inferencia


estadística se desea corroborar si se distribuyen de manera normal.
Probar la hipótesis nula de que la distribución de la muestra es
normal.

SOLUCIÓN

Paso 1. Establecer las hipótesis a probar

H o=La distribución de la muestra es normal.

H i=La distribución dela muestra no es normal.

Paso 2. Elegir la prueba estadística

Dado que interesa probar que la muestra presenta distribución


normal y se cuenta con puntajes individuales y en escala de razón, y
la muestra fue tomada de forma aleatoria, se aplicará la prueba de
Shapiro-Wilk.

Paso 3. Especificar alfa


Se empleará un α = 0.05

Paso 4. Región de Rechazo

Todos los valores menores o iguales a W T con un alfa de 0.05

Paso 5. Decisión

Para obtener el valor observado de W y tomar la decisión estadística


se aplica el procedimiento con la fórmula de W.

Obtener el estadístico:

Calcular los datos necesarios para aplicar la fórmula de W como se


muestra en la tabla 1. Los coeficientes An−i+1 para calcular b se
obtienen de la tabla 17. El número de coeficientes a emplear se
determina dividendo la muestra a la mitad, si n es par la mitad es
exacta (n=2 k), sí n es impar considera el número inmediato
superior (n=2 k+1). El valor de cada coeficiente se obtiene
interceptando el tamaño de n con el de i (número de coeficiente). En
el ejemplo n = 7, la mitad sería 3.5, por lo tanto, se considerará 4
como el número de coeficientes a obtener. Consultando la tabla 17,
tenemos que para n = 7 el primer coeficiente tiene un valor de
0.6233, como se puede
Observar en el siguiente extracto de la tabla 17.
Niveles de significación para el contraste de Shapiro-Wilks.
Tabla 17
Obtener W de tablas.

El valor de W T se obtiene de la tabla 18 interceptando el tamaño de

n = 7 con el nivel de significancia especificado.

Niveles de significación para el contraste de Shapiro-Wilks.


Tabla 18

Comparar el valor observado y el valor esperado aplicando la


regla de decisión

0.9530>0.803

H o=La distribución de la muestra es normal.

H i=La distribución de la muestra no es normal.

Dado que W O > W T , α = 0.05; podemos aceptar H0

Decisión estadística: Dado que aceptamos H0 podemos decir que la

distribución de la muestra es normal.


Conclusión

Existe suficiente evidencia estadística para decir que los datos de la muestra se
distribuyen de manera normal, por lo tanto, se puede asumir que se cumple el
supuesto de normalidad y se puede proceder a analizar los datos con estadística
paramétrica
Bibliografía

(Humberto Gutiérrez Pulido, 2008)

(Levene, 2013)
(Discovery, 2015)

También podría gustarte