Está en la página 1de 60

Pruebas no paramtricas

Captulo 7, Visauta Vinacua, Anlisis Estadstico Con SPSS . Docente: Tamara Otzen

Pruebas Estadsticas

Paramtricas

No Paramtricas

Nos permiten analizar cualquier dato siempre y cuando su distribucin sea normal

Nos permiten analizar datos en escala nominal u ordinal a pesar de que no se conozcan los parmetros de una poblacin, utilizada para hacer un contraste de hiptesis.

Pruebas no paramtricas
Utilizacin:
Cuando los datos puntualizan a las escalas nominal u ordinal. Se utiliza solo la frecuencia. Poblaciones pequeas. Cuando se desconocen los parmetros media, moda, etc. Cuando los datos son independientes. Cuando se quiere contrastar o comparar hiptesis. Investigaciones de tipo social. (Muestras pequeas no representativas <5). Cuando se requiere de establecer el nivel de confianza o significatividad en las diferencias. Cuando la muestra es seleccionada no probabilsticamente.

Requisitos de para los anlisis estadsticos con pruebas paramtricas


Que la(s) muestra(s) proceda(n) de poblaciones en las que la(s) variable(s) se distribuyen segn una ley normal.
Que las varianza en ambas poblaciones no difieran significativamente. Que alguna o algunas variables estn medidas al menos en una escala de intervalo o razn.

Pruebas No Paramtricas en SPSS

PRUEBAS T
Capitulo 9 y 10, Aron y Aron, Estadstica para Psicologa.

Introduccin
Cuando se desea comprobar si los valores de una caracterstica que es posible cuantificar (como podra ser la edad o la cifra de tensin arterial, entre otras) difieren al agruparlas en dos o ms grupos (por ejemplo segn gnero, o por diagnstico de hipertensin arterial) hablaremos de comparacin de medias.

Dentro del men que incluye SPSS se encuentra la opcin comparar medias, la cual nos permite calcular las medias y otros estadsticos, as como la comparacin de medias para diferentes tipos de variables, mediantes las pruebas de t de Student y ANOVA.

PRUEBAS T DE STUDENT

La prueba t de Student es utilizada para la estimacin de medias y proporciones en variables cuantitativas y para la comparacin de medias y proporciones en distintas poblaciones. El procedimiento Comparar medias ofrece varias opciones en funcin de la procedencia de los datos que queremos comparar.

Para una muestra


Hi: El promedio muestral es distinto al poblacional

Para Muestras Independientes


Hi: El promedio del grupo 1 difiere del promedio del grupo 2

Para Muestras Relacionadas


Hi: El promedio del grupo 1 cambiar en el tiempo

Supuestos de la prueba t
La distribucin normal de los observadores La homogeneidad de las varianzas La independencia del error

La homogeneidad de varianzas (Homocedasticidad) Test de Levene La homogeneidad se cumple cuando el p no es significativo

La independencia del error


Por medio de la seleccin aleatoria de los sujetos a los grupos. Se define en el diseo

Distribucin Normal de las Observaciones


Se obvia cuando las muestras son mayores a 50 por cada grupo.

PRUEBA DE KOLMOGOROV-SMIRNOV
La distribucin del estadstico de Kolmogorov-Smirnov es independiente de la distribucin poblacional especificada en la hiptesis nula y los valores crticos de este estadstico estn tabulados.
Si la distribucin postulada es la normal y se estiman sus parmetros, los valores crticos se obtienen aplicando la correccin de significacin propuesta por Lilliefors. H0 : Las varianzas son iguales (son homogeneas)

PRUEBA DE SHAPIRO-WILK
Cuando la muestra es como mximo de tamao 50 se puede contrastar la normalidad con la prueba de shapiro Shapiro-Wilk.
Se rechazar la hiptesis nula de normalidad si el estadstico W es menor que el valor crtico proporcionado por la tabla elaborada por los autores para el tamao muestral y el nivel de significacin dado. H0 : Las varianzas son iguales (son homogeneas)

Contrastes de normalidad
Un caso especfico de ajuste a una distribucin terica es la correspondiente a la distribucin normal. Este contraste se realiza para comprobar si se verifica la hiptesis de normalidad necesaria para que el resultado de algunos anlisis sea fiable, como por ejemplo para el ANOVA.

Para comprobar la hiptesis nula de que la muestra ha sido extrada de una poblacin con distribucin de probabilidad normal se puede realizar un estudio grfico y/o analtico.

La distribucin normal
Test de Kolmogorov Smirnov

Cuando presenta un valor p no significativo da cuenta de la distribucin normal de ambos grupos


Si p es significativo se debe aplicar una prueba no parametrica (U de Mann Whitney) Ho: Las distribuciones son normales. H1: Las distribuciones no son normales

PRUEBA DE KOLMOGOROV-SMIRNOV
Cuando la prueba Kolmogorov-Smirnov kolmogorov se aplica para contrastar la hiptesis de normalidad de la poblacin, el estadstico de prueba es la mxima diferencia. La distribucin del estadstico de Kolmogorov-Smirnov es independiente de la distribucin poblacional especificada en la hiptesis nula y los valores crticos de este estadstico estn tabulados. Si la distribucin postulada es la normal y se estiman sus parmetros, los valores crticos se obtienen aplicando la correccin de significacin propuesta por Lilliefors.

PRUEBA DE SHAPIRO-WILK
Cuando la muestra es como mximo de tamao 50 se puede contrastar la normalidad con la prueba de shapiro Shapiro-Wilk. Para efectuarla se calcula la media y la varianza muestral, S2, y se ordenan las observaciones de menor a mayor. A continuacin se calculan las diferencias entre: el primero y el ltimo; el segundo y el penltimo; el tercero y el antepenltimo, etc. y se corrigen con unos coeficientes tabulados por Shapiro y Wilk.
Se rechazar la hiptesis nula de normalidad si el estadstico W es menor que el valor crtico proporcionado por la tabla elaborada por los autores para el tamao muestral y el nivel de significacin dado.

Y si no.
Para 1 muestra: Wilcoxon Muestras Relacionadas: VARIABLES CUALITATIVAS: TEST DE Mc NEMAR: evala las variaciones de una variable dicotmica antes y despus de algo VARIABLES CUANTITATIVAS CONTRASTE DE LOS SIGNOS PARA LA MEDIANA DE LAS DIFERENCIAS: para variables continuas evaluamos las diferencias de antes y despus de algo pero a travs de su signo: +, - 0 TEST DE LOS RANGOS CON SIGNO DE WILCOXON: DATOS APAREADOS: similar al test de los signos por aumento o disminucin de la variable; pero teniendo adems en cuenta la magnitud del cambio . Por tanto es ms potente este test que el test de los signos.

Para muestras Independientes: TEST DE LA MEDIANA la prueba se fundamenta en analizar si las medianas de las ms de dos poblaciones son distintas. Esta prueba es adecuada para comparar ms de dos variables cuantitativas y los tamaos poblacionales pueden ser distintos. El test se basa en que si las dos medianas son iguales, la proporcin de casos de cada muestra que son mayores o menores que la mediana global sern iguales. Pero por el contrario, si ambas medianas son diferentes, la proporcin de casos por encima o por debajo de la mediana global sern significativamente diferentes en ambas muestras. Es decir, realiza tablas de contingencia al categorizar la variable continua en dos categoras segn el valor de la mediana. Por tanto, la hiptesis nula: Ho es que la Mediana de A = Mediana de B=...= Mediana de n; mientras que la hiptesis alternativa, H1: es que al menos 1 es diferente.

Prueba t para una muestra clculo manual


La varianza de la muestra ser levemente menor que la varianza de la poblacin = Estimacin sesgada de Varianza poblacional Esto se reduce si conocemos la media de la poblacin Para el calculo se considera el numero de sujetos menos 1 para el que el resultado de ligeramente mayor. Smbolo = S2 S2 = (X-M)2 = SC N-1 N-1 S = S2 Varianza de la distribucin de las medias = S 2M = (S2 / N) No sigue la distribucion normal, si no que la distribucin t
Las colas son ms gruesas Buscar punto de corte en la tabla t con grados de libertad.

Pasos para calculo de Prueba t para una muestra


1. Replantear el problema en funcin de hiptesis e hiptesis nula sobre poblaciones. 2. Determinar las caractersticas de la distribucin comparativa. 3. Determinar el valor muestral de corte en la distribucin comparativa, a partir del cual debera rechazarse la hiptesis nula. 4. Determinar e valor muestral en la distribucin comparativa. 5. Comparar los valores de los pasoso 3 y 4 para decidir si se rechaza o no la hiptesis nula.

Ejemplo
1. Replantear el problema en funcin de hiptesis e hiptesis nula sobre poblaciones. Cuestionario de sentirse esperanzado ( de 1 a 7) Punto medio de la escala 4 Poblacin 1: personas que sufrieron inundacin Poblacin 2: personas que no sufrieron inundacin Ho: x1 = x2 Hi: x1 x2 Muestra 10 personas 2= 3,57 Media muestral = 4,7

2. Determinar las caractersticas de la distribucin comparativa. Varianza poblacional estimada de 3,57 = (32,10 /9) Varianza muestral estimada = 3,57 / 10 = 0,36 Desviacin estndar muestral estimada = 0,36 = 0,60

Ejemplo continuacin.
3. Determinar el valor muestral de corte en la distribucin comparativa, a partir del cual debera rechazarse la hiptesis nula. Nivel de significancia de 0,01 No es hiptesis direccional Ver tabla = Prueba de dos colas, con 9 grados de libertad = 3,25 4. Determinar e valor muestral en la distribucin comparativa. Media muestral 4,7 (0,7/0,6) = 1,17 = t = 1,17 5. Comparar los valores de los pasoso 3 y 4 para decidir si se rechaza o no la hiptesis nula.
Se acepta la hiptesis de nulidad

2. UNA MUESTRA EN SPSS


En este caso se efecta un contraste de hiptesis para comprobar si la media de una variable difiere de forma significativa de un valor que nosotros mismo seleccionamos En este caso hay que seleccionar la variable elegida y el valor que queremos contrastar. Al pulsar Aceptar se efectuar el contraste de hiptesis.

En valor de prueba se introduce 12,55 ya que es el promedio de beneficios de todas las empresas

Resultados:

Puesto que el valor de significacin es mayor a 0,05 no se puede rechazar la hiptesis nula.

DOS MUESTRAS CON DATOS APAREADOS O RELACIONADOS


En este caso las muestras no son independientes sino que estn relacionadas. Lo ms habitual es que se trate de variables mediadas en los mismos casos en dos momentos temporales diferentes, o que sean casos apareados en funcin de otras variables. En el cuadro de dilogo hay que seleccionar el par de variables cuyas medias vamos a comparar, y pasarlo al campo de la derecha Variables relacionadas.

Manual
Nmero de sujeto 1 2 3 4 5 Antes 4,7 6,5 4 5,8 4,2 Despues 5 6,6 4,2 5,8 4

Recordandopara una muestra


Numero de sujeto 1 2 3 4 5 Diferencia Diferencia al Respuesta del promedio cuadrado 3 0,2 0,04 2 -0,8 0,64 4 1,2 1,44 1 -1,8 3,24 4 1,2 1,44 14 6,8 2,8

Nmero de sujeto

Antes

Despus

Diferencia

Desvo

Desvo Cuadrtico

1
2 3 4 5

4,7
6,5 4 5,8 4,2

5
6,6 4,2 5,8 4

-0,3
-0,1 -0,2 0 0,2
Suma de las diferencias

-0,22
-0,02 -0,12 0,08 0,28 -0,4

0,0484
0,0004 0,0144 0,0064 0,0784
Suma de los D.C.

0,148

Promedio de las diferencias

-0,08

M
gl u

=
= =

-0,08
4 0

-0,4 /5
5-1 (valor fijo tomado como base de ausencia de cambio)

S2
S2m Sm N.S. t t real

=
= = = = =

0,037
0,0074 0,086023253 0,05 2,1318 -0,92998111

0,148/4
0,037/5 0,0074 1 cola (-0,08 0)/0,086023253

EN SPSS

Paso 1:

Paso 2:

Resultados:

En esta figura aparecen el numero de empresas, el coeficiente de correlacin entre ambas variables y el nivel de significacin del mismo.

Prueba t para 1 muestra

Numero 1 2 3
-2 colas - Parmetro poblacional 5

Puntaje 3 4,6 2,2

Numero 1 2 3

Antes 3 4,6 2,2

Despues 4 2 8

Dos colas

3. DOS MUESTRAS CON DATOS INDEPENDIENTES


En este tipo de muestras se usa para comparar medias de variables en dos grupos de casos que son independientes entre s, de forma que los sujetos de cada grupo deberan haber sido elegidos de forma aleatoria.

MANUAL
Nmero de sujeto 1 2 3 4 5 Numero de sujeto 6 7 8 9 10

PSICO 5,6 6,9 3,2 4,3 5,4

MED 4,2 6,7 6,6 3,2 4,6

Nmero de sujeto 1 2 3 4 5

PSICO 5,6 6,9 3,2 4,3 5,4


Suma 25,4 Promedio

Desvio de la media 0,52 1,82 -1,88 -0,78 0,32 5,08 Desvio de la media -0,86 1,64 1,54 -1,86 -0,46 5,06

Desvio cuadratico de la media 0,2704 3,3124 3,5344 0,6084 0,1024 Suma de los D.C. 7,828 Desvio cuadratico de la media 0,7396 2,6896 2,3716 3,4596 0,2116 Suma de los D.C. 9,472

MED 6 7 8 9 10 4,2 6,7 6,6 3,2 4,6


Suma 25,3
Promedio

PSICO

S2 1 N1 gl1 S2m1 M1

= = = = = = =

1,957 5 4 0,4325 5,08 2,368

7,828/4 5-1 2,16/5 25,4/5 9,472/4 5-1 2,16/5 25,3/5 4+4 ((gl1/gltotal)*(S21))+ (gl2/gltotal)*(S22)) S2m1+S2m2 S2m1+S2m2 dos colas 2,306 (M1-M2)/Sdiferencia

MED

S2 2 N2 gl2 S2m2 M2

gl total S2combinada S2diferencia Sdiferencia N.S. T necesario T real

= = = = = = =

5 4 = 0,4325 = 5,06 = 8 2,1625 0,865 0,93005376


0,05 -2,306

0,02150413

Ahora.. Paso 1

Paso 2

Paso 3

En este paso se exige introducir las dos categoras de esta variable. En grupo 1 se introduce 1 (servicios), y en grupo 2 se introduce 2 (industriales).

Resultados:

PARA MUESTRAS INDEPENDIENTES EN SPSS

La homogeneidad de varianzas (Homocedasticidad)

Test de Levene

La homogeneidad se cumple cuando el p no es significativo


Ho: Homogeneidad de varianzas. H1: No Homogeneidad de varianzas

Grfico del promedio de una variable continua de una variable dicotmica

Valores en prueba t
t: estadstico utilizado para el contraste de hiptesis. gl: nmero de grados de libertad del estadstico t. Cuando se asumen varianzas iguales, gl es igual a (n1 + n2 2), pero cuando las varianzas no son iguales hay que calcularlo de otras formas. La ms usada es la aproximacin de Satterthwaite, que SPSS calcula. Este valor ser menor que el anterior porque se pierde precisin con la desigualdad de las varianzas.

Valores en prueba t
Sig. (bilateral) : valor p de significacin estadstica obtenido para el contraste de hiptesis.
Diferencia de medias : estimador puntual de la diferencia de medias.

Valores en prueba t
Error tp. de la diferencia : valor del error estndar de la diferencia de medias (obtenido a partir de los errores estndar de la tabla superior). Intervalo de confianza para la media : lmites inferior y superior del intervalo de confianza que valora la precisin dela estimacin que estamos realizando para la diferencia de medias.