Está en la página 1de 59

Supuestos normales

Laura A. Muoz Castaeda


Son obtenidas al azar de una poblacin con una
distribucin normal

Consiste en observaciones independientes

Excepto en datos pareados

Consiste en valores en un intervalo o escala de radio


medibles
Tienen poblaciones con varianzas
aproximadamente iguales

Son adecuadamente grandes

Aproximadamente se asemejan a una


distribucin normal
Si alguna de las muestras no cumple una ellas,
se violan las suposiciones de una prueba
paramtrica.
Por lo tanto.
Cambiar la naturaleza del estudio

Escalas de medida ordinales o nominales usar


intervalo o escalas

Buscar mas participantes para aumentar el


tamao de la muestra
Modificar las muestras.

Opciones para usar pruebas paramtricas.

Remover valores extremos (outliners).

Justificar razones.
Pruebas
Normalidad

Homeocedasticidad
de varianza

Independencia
Hiptesis nula vs hiptesis alternativa

Ho: Existe una distribucin normal, no hay


efecto.

Ha: No asemeja una distribucin normal.


Existe un efecto.
Pruebas de normalidad
La normalidad significa que la prueba esta
normalmente distribuida (en forma de
campana) con media 0, con una desviacin
estndar 1 y una curva de forma simtrica.
Skewness y kurtosis test

Kolmogorov Smirnov test

Shapiro-Wilks W test
Skewness y kurtosis test
Distribucin normal.

Coeficiente de asimetra y Kurtosis.

Si uno de los valores obtenidos no se aproxima


a cero, el conjunto de datos no se distribuye
normalmente.
Indica asimetra y direccin del sesgo.

Tomando en cuenta la media.


Menor a -1 o mayor a 1: Extremadamente
sesgada.

-1 y -0.5 o 0.5 y 1: moderadamente sesgada.

-0.5 y 0.5: aproximadamente sesgada


Kurtosis
Indica lo forma de la distribucin.

Campana de Gauss.

Datos extremos o colas (Tails).


Shapiro-Wilks W test
Cada una de las distribuciones tiene una media.

Tamao igual o menor a 50

Demasiado sensibles a desviaciones pequeas


en pruebas muy grandes

Complementar con otra prueba


Kolmogorov Smirnov
D= supx l Fs (x) Ft (x) l n

D: valor mayor sobre todas las x.


Fs: frecuencia acumulada n
Ft: variable normal estndar
Ordenar los datos de menor a mayor.

Calcular .

frecuencia y frecuencia acumulada.

fs(x): frec. acum./ n.


Ejemplo
Se efectuaron mediciones del nivel de glucosa
en la sangre de 36 hombres adultos en ayuno,
no obesos y aparentemente sanos.

Se pretende saber si es posible concluir que


tales datos no pertenecen a una poblacin
que sigue una distribucin normal.
X Frecuencia Frecuencia Fs(x)
acumulada
68 2 2 0.0556
72 2 4 0.1111
75 2 6 0.1667
76 2 8 0.2222
77 6 14 0.3889
78 3 17 0.4722
80 6 23 0.6389
81 3 26 0.7222
84 2 28 0.7778
86 2 30 0.8333
87 2 32 0.8889
92 4 36 1
Calcular
Valor de z (Media / desviacin estndar).

Ft(t)
x z= (x-80)/6 Ft(x)
68 -2 0.0228
72 -1.33 0.0918
75 -0.83 0.2033
76 -0.67 0.2514
77 -0.50 0.3085
78 -0.33 0.3787
80 0.00 0.5000
81 0.17 0.5675
84 0.67 0.7486
86 1 0.8413
87 1.17 0.8790
x 777(x) Ft(x) Fs (x) Ft (x)
x 0.0556 0.0228 0.0328
68 0.1111 0.0918 0.0193
72 0.1667 0.2033 0.0366
75 0.2222 0.2514 0.0292
76 0.3889 0.3085 0.0804
77 0.4722 0.3787 0.1015
78 0.6389 0.5000 0.1389
80 0.7222 0.5675 0.1547
81 0.7778 0.7486 0.0292
84 0.8333 0.8413 0.0080
86 0.8889 0.8790 0.0099
87 1 0.9772 0.0228
Seleccionar el valor mas grande dentro de la
ultima tabla (Fs (x) Ft (x)).

D=0.1547

Buscar el valor de D (normalidad) en la tabla


de Kolmogorov Smirnov.

Usar nivel de significancia = 0.05


D calculada=0.1547
D normal: 0.221

Para descartar Ho, la D calculada debe ser


mayor a la D normal.
Pruebas grficas de normalidad
Q-Q plot

Box plot

Normal probability
plot

Histograma
Normal probability plot

Organizar valores en orden ascendente.

Calcular fi= (i-0.375)/(n+0.25).

i= la posicin del valor en la lista ordenada.


Buscar el valor de z para cada fi.

Coloca los valores x en el eje horizontal y el


valor de z correspondiente en el eje vertical.
http://www.statisticshowto.com/normal-
probability-plot/
Independencia
Ji-Cuadrada
Probar si dos criterios de clasificacin son
independientes.

Independientes si su distribucin es la misma


sin importar la distribucin del otro.
Las mujeres infectadas con VIH que tambin
estn infectadas con PVH, tienen mayor
probabilidad de tener anormalidades
citolgicas cervicales que las mujeres con uno
de los dos virus.
Se pretende saber si existe relacin entre el
estadio de PVH y la etapa de infeccin por VIH.
Obtener el valor tabulado de X2 usando los
grados de libertad y el intervalo de confianza.

df: (r-1)(c-1)

r: renglones de primer criterio.


C: columnas del segundo criterio.
: 0.05
df: (r-1)(c-1) : 0.05
(2-1)(3-1)
(1)(2) X2: 5.991
df: 2
Elaborar una tabla de contingencia con los
valores de las diferentes categoras.

Obtener los totales de cada categora.

Calcular las frecuencias esperadas para cada


casilla.
Calculo de la frecuencia esperada

Multiplicar el total del rengln por el total de


la columna y dividir el producto entre el gran
total.

Ei: ((total c)(total r))/total G


Tabla de contingencia
V I H

PVH Seropositivo Seropositivo Seronegativo Total


sintomtico asintomtico

Oi Ei Oi Ei Oi Ei
+ 23 (12.72) 4 (6.94) 10 (17.34) 37

Oi Ei Oi Ei Oi Ei
-- 10 (20.28) 14 (11.06) 35 (27.66) 59

Total 33 18 45 96

Ei:((33)(37))/96= 12.72
X2= (23-12.72)2/12.72 + (4-6.94)2/6.94..
+(35-27.66)2/27.66

8.30805 + 1.24548 +.+1.94778= 20.60081


Para aceptar Ho el valor de X2 obtenida debe
ser menor al X2 esperada.

Si es igual o mayor se rechaza Ho.

X2obtenida: 20.60081
X2esperada: 5.991
Por lo tanto.
Se concluye que si hay relacin entre el
estadio de PVH y la etapa de infeccin por VIH.
Pruebas de homeocedasticidad de varianzas
Prueba de Levene
Probar si existen varianzas iguales entre los
grupos

Compara la distancia o diferencia de cada


valor respecto a la media del grupo que
pertenece

Distribuciones que no son normales.


Prueba de Barttlett
Probar si las varianzas son iguales.

Usarlo si se esta convencido de que las


variables tienen distribucin normal.
https://es.slideshare.net/rfmflores/prueba-
de-homogeneidad-de-varianza
Bibliografa
https://
books.google.com.mx/books?id=UwPc7kbwQ
4AC&pg=PA181&dq=mann+whitney+test&hl=e
s&sa=X&ved=0ahUKEwj9sOTKkvjVAhWIqFQKHf
0jCZkQ6AEIPzAD#v=onepage&q=mann%20whit
ney%20test&f=false
http://www.statisticssolutions.com/mann-whit
ney-u-test
/
https://
books.google.com.mx/books?id=Fl0VFNnyD
C. Ireland. Experimental Statistics for
Agriculture and Horticulture. Cambridge.
2010.(pg. 181-182).
Statistic Solutions 2017.
http://www.statisticssolutions.com/mann-
whitney-u-test/.6:00pm.
http://www.statisticshowto.com/levene-test/
https://
books.google.com.mx/books?id=5KdXV7lxH
lEC&pg=PA90&dq=shapiro+wilk&hl=es&sa=X
&ved=0ahUKEwipy_iW4frVAhUI2mMKHe-cCSQQ
6AEIMDAC#v=onepage&q=shapiro%20wilk&f=
false
http://www.itl.nist.gov/div898/handbook/eda
/section3/probplot.htm
https://
cdn.shopify.com/s/files/1/0392/9333/product
s/pin-cervix-copyright_compact.jpg?v=144182
3222

También podría gustarte