0% encontró este documento útil (0 votos)
184 vistas49 páginas

Estadística No Paramétrica: Métodos y Pruebas

Este documento describe diferentes procedimientos estadísticos no paramétricos como la prueba de rachas y la prueba U de Mann-Whitney. Explica cómo se aplican estos métodos para probar hipótesis sobre datos que no cumplen los supuestos paramétricos.

Cargado por

Francisco Javier
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
184 vistas49 páginas

Estadística No Paramétrica: Métodos y Pruebas

Este documento describe diferentes procedimientos estadísticos no paramétricos como la prueba de rachas y la prueba U de Mann-Whitney. Explica cómo se aplican estos métodos para probar hipótesis sobre datos que no cumplen los supuestos paramétricos.

Cargado por

Francisco Javier
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

CAPACITACIÓN, INVESTIGACIÓN,

ESTADÍSTICA Y MERCADEO

[Link]/blog
[Link]
ESTADISTICA NO PARAMETRICA

[Link]
ESTADISTICA NO PARAMETRICA
Son procedimientos
estadísticos para prueba
de hipótesis que no
requieren de la suposición
de la normalidad de la
población de la cual fue
extraída la muestra y se
pueden aplicar a datos de
[Link]

tipo cuantitativo y
ldbello@[Link]
VENTAJAS DESVENTAJAS

• No se requiere de los • Utilizan menor


supuestos
paramétricos información de la
• Se puede usar para variable.
variables no •
numéricas. Es menos potente
• Cálculos fáciles, que los resultados
originados por obtenidos en los
tamaños de muestra métodos
pequeños.
• Son convenientes paramétricos.
cuando no se conoce
la distribución de la
población.
[Link]
ldbello@[Link]
Procedimientos Clásicos
TIENE CUATRO CARACTERISTICAS DISTINTIVAS:

– Nivel bastante complejo de medición, (datos


continuos y cuantitativos)
– Implican prueba de los parámetros
hipotéticos
– Suposiciones estrictas (normalidad,
homogeneidad de varianzas).
– Que las observaciones sean independientes
entre sí
[Link]
ldbello@[Link]
¿ Qué debería hacer el
estadístico cuando los
procedimientos clásicos
no son aplicables?
Procedimientos No Paramétricos

No depende de la forma de la distribución


subyacente de N.

[Link]
ldbello@[Link]
Rachas
Por rachas se entiende a una sucesión de
símbolos idénticos que pueden estar separados o
no por otro tipo de símbolos. Por ejemplo, sea
una serie de mediciones de magnitudes
dicotómicas identificadas con los símbolos de
resultado positivo (+) o negativo (-) a juicio del
investigador.
Resultados: + + - - - + - - - - + + - +
Nº de rachas: 1 2 3 4 5 6 7
El número de rachas es r = 7. El número total de rachas
indica si una muestra es o no aleatoria.

[Link]
ldbello@[Link]
Prueba de Rachas con una
Muestra
Los elementos
Ho:
de la muestra
Formulación están mezclados
de la aleatoriamente
hipótesis

Los elementos
H 1: no están
Límites de la mezclados
región de aleatoriamente
 = nivel de significancia
aceptación [Link]
ldbello@[Link]
Procedimiento Rachas
1) Se calcula el número n1 de elementos de una
clase identificadas por un símbolo y n2 la
cantidad de elementos de la otra.

2) Se ordenan los n = n1 + n2 sucesos en el


orden en que ocurrieron.

3) Se cuenta el número r de rachas.

4) Se determina la probabilidad que ocurran r


rachas, usando Ho, y se compara con el nivel
de significación α adoptado para aceptar o
rechazar la Ho. También se puede probar con
[Link]
el número de rachas. ldbello@[Link]
Prueba de Rachas con una
Muestra
n1 = número de ocurrencias tipo 1
Símbolos
n2 = número de ocurrencias tipo 2
r = número de corridas

Media del r = 2n1 n2 + 1


Estadístico (n1 + n2 )

Cálculo del r =  2n1 n2 (2n1 n2 - n1 - n2)


error (n1 + n2)2 (n1 + n2 - 1)
estándar

[Link]
ldbello@[Link]
Prueba de Rachas con una
Muestra
La distribución de muestreo de r puede
Elección de aproximarse mucho mediante la
la distribución normal, si n1 o n2 es mayor
Distribución que 20

Si el estadístico muestral r cae dentro


Interpretació de la región de aceptación es valida la
n de hipótesis nula y concluir que los
resultados elementos están siendo introducidos en
modo aleatorio

[Link]
ldbello@[Link]
Salida SPSS 19.0
Prueba de rachas
Prueba de rachas
Consumo
(l/100Km) Tensión Puntuación
Valor de pruebaa 10.00 Valor de pruebaa 1.50 10.00
Casos < Valor de prueba Casos < Valor de prueba 24 22
169
Casos >= Valor de
Casos >= Valor de 24 26
229 prueba
prueba
Casos en total 48 48
Casos en total 398 Número de rachas 4 24
Número de rachas 80 Z -5.982 -.098
Z -11.862 Sig. asintót. (bilateral) .000 .922
Sig. asintót. (bilateral) .000 a. Mediana
a. Mediana

[Link]
ldbello@[Link]
EJEMPLO MUESTRAS PEQUEÑAS
12 niños y 12 niñas de 4 años de edad
observados durante dos sesiones de
juego de 15 minutos, el juego fué
calificado por incidencia y grado de
agresión. con estos puntajes es posible
probar la hipótesis que hay diferencias
sexuales en la cantidad de agresión
exhibida.
Niños (h) Niñas (m)
86 55
69 40
72 22
65 58
113 16
65 7
118 9
45 16
141 26
104 36
41 20
50 15
1)    SE COLOCAN LOS PUNTAJES n1+ n2
EN UNA SOLA SERIE ORDENADA

7 9 15 16 16 20 22 26 36 40
m m m m m m m m m m
41 45 50 55 58
h h h h h
65 65 69 72 86 104 113 118 141
h h h h h h h h h
2) SE DETERMINA EL NÚMERO DE
RACHAS

3. HIPÓTESIS

Ho: LA INCIDENCIA Y EL GRADO DE AGRESIÓN


SON LOS MISMOS EN LOS NIÑOS DE CUATRO
AÑOS DE AMBOS SEXOS

Ha: LOS NIÑOS Y NIÑAS DE CUATRO AÑOS DE


EDAD MUESTRAN DIFERENCIAS EN LA
INCIDENCIA Y EL GRADO DE AGRESIÓN
4. NIVEL DE
SIGNIFICACIÓN
alfa=0.05 N = 12 NÚMERO DE
1
NIÑOS N2 = 12 NÚMERO DE NIÑAS

5. REGLA DE
DECISIÓN
SI VALOR OBSERVADO DE R ES
IGUAL O MENOR QUE EL VALOR
TABULADO DE N1 =12 Y N2 =12,
Ho SE RECHAZA A UN NIVEL DE
SIGNIFICACIÓN 0.05
LA TABLA MUESTRA QUE PARA LOS
VALORES DE n1=12 Y n2=12, UNA
R DE 7 ES SIGNIFICATIVA AL NIVEL
DE 0.05.
YA QUE EL VALOR DE R ES MENOR
QUE EL TABULADO, SE PUEDE
RECHAZAR LA HO, CONCLUYENDO
QUE LOS NIÑOS Y LAS NIÑAS
MUESTRAN DIFERENCIAS EN LA
AGRESIÓN EN LA SITUACIÓN DE
JUEGO LIBRE
La Prueba U de Mann-
Whitney
Se utiliza para saber si dos muestras
independientes provienen de poblaciones que
difieren en su ubicación (tendencia central).

Es la contraparte de la prueba t para muestras


independientes. Prueba la hipótesis de que la mediana
de las dos poblaciones son iguales contra que no lo
son.

Si Ho es cierta, el promedio de los rangos para los dos


grupos muestrales debe ser aproximadamente igual.
[Link]
ldbello@[Link]
La Prueba U de Mann-
Whitney
Ordenación Ordenar por rangos todos los elementos
que deben probarse, en orden creciente
por rango

n1 = número de elementos de la muestra


Símbolos 1
n2 = número de elementos de la muestra
2
R1 = suma de los rangos de los
elementos de la muestra 1
[Link]
R2 = suma de los rangos de los
ldbello@[Link]
elementos de la muestra 2
La Prueba U de Mann-
Whitney

Estadístico U U = n1 n2 + n1 (n1 + 1) – R1
2
Una medida de la diferencia entre las
observaciones ordenadas por rangos de las
dos muestras

Media del U = n1 n2
Estadístico 2

Cálculo del u =  n1 n2 (n1 + n2 + 1)


error 12 [Link]
estándar ldbello@[Link]
Prueba de Suma de Rangos:
La Prueba U de Mann-Whitney

Ho: Me1 = Me2 Hipótesis nula, no hay


Formulación diferencia entre las dos poblaciones, por
de la lo cual tienen la misma mediana
hipótesis H1: Me1  Me2 Hipótesis alternativa, hay
una diferencia entre las dos poblaciones,
por lo cual tienen medianas diferentes
Límites de la
región de  = nivel de significancia
aceptación
[Link]
ldbello@[Link]
Prueba de Suma de Rangos:
La Prueba U de Mann-Whitney

Elección de En caso de que algún n sea mayor de 20,


se puede aproximar con la distribución
la
normal.
Distribución

Si el estadístico muestral U cae dentro


Interpretació de la región de aceptación es valida la
n de hipótesis nula de que no hay diferencia y
resultados concluiremos que las distribuciones son
iguales

[Link]
ldbello@[Link]
La Prueba de Wilcoxon con
signo
Una prueba que utiliza dirección y magnitud,
propuesta en 1945 por Frank Wilcoxon, se llama
ahora comúnmente prueba de rango con
signo de Wilcoxon.

Esta prueba se aplica en el caso de una


distribución continua simétrica.

Utiliza las magnitudes de las diferencias entre las


mediciones y un parámetro de ubicación según
una hipótesis, en lugar de los signos de las
[Link]
diferencias ldbello@[Link]
Suposiciones

• La muestra es aleatoria
• La variable es continua
• La población se distribuye
simétricamente alrededor de su media 
• La escala de medición es al menos de
intervalo

[Link]
ldbello@[Link]
Hipótesis

a) Ho:  = o b) Ho:   o b) Ho:   o

Ha:   o Ha:  < o Ha:  > o

Estas son las hipótesis que pueden probarse para


alguna media de población no conocida o
Pasos para la prueba de Wilcoxon
con signo
1. Restar la media hipotética o de
cada observación

Di = x i - o

Se elimina cualquier diferencia que


de cómo resultado cero.
Tener en cuenta que se reduce el
tamaño de n.
2. Ordenar las diferencias de menor
a mayor sin importar el signo (sólo
el valor absoluto).

Si dos o más son iguales asignar a


cada valor la media de la posición
que ocupa en la lista.
3. Asignar:
• A las diferencias positivas se les
asigna como W+
• A las diferencias negativas se les
asigna como W-
• Sumar cada grupo
• El menor valor de los dos
anteriores se asigna como W.
4. Comparar los valores obtenidos con
los valores críticos en la tabla (0.05,
0.025 y 0.01)

N es el número de diferencias
halladas, sin tomar en cuenta las que
son iguales a cero.
Ejemplo

En un experimento para medir la efectividad


de un medicamento para dormir, basándose
en las horas de sueño de los pacientes, un
sicólogo seleccionó aleatoriamente 10
pacientes a los cuales se les suministró el
medicamento y luego un placebo.

La siguiente tabla muestra las horas de sueño


de cada paciente con la sustancia
suministrada, así como las diferencias,
rangos y conclusión.
Horas de sueño
Droga Placebo Rango
Paciente Diferencia (Ignorando el signo)
1 6.1 5.2 0.9 3.5*
2 7.0 7.9 -0.9 3.5*
3 8.2 3.9 4.3 10
4 7.6 4.7 2.9 7
5 6.5 5.3 1.2 5
6 8.4 5.4 3.0 8
7 6.9 4.2 2.7 6
8 6.7 6.1 0.6 2
9 7.4 3.8 3.6 9
10 5.8 6.3 -0.5 1
W+ = 50.5 W- = 4.5 W = 4.5
Ho: la efectividad de la droga es mayor que la
del placebo
Ha: la efectividad de la droga es menor a la del
placebo.

* Los rangos 3ro y 4to han sido promediados

W+ = 50.5 W- = 4.5 W = 4.5

Como W = 4.5, con una significación de 0.025


se puede afirmar que el medicamento sí es
efectivo.
Valores críticos de T en la prueba de rangos señalados de los pares igualados de Wilcoxon

Nivel de significación para prueba de una cola


.025 .01 .005
N
Nivel de significación para prueba de dos colas
.05 .02 .01
6 0 --------- --------
7 2 0 --------
8 4 2 0
9 6 3 2
10 8 5 3
11 11 7 5
12 14 10 7
13 17 13 10
14 21 16 13
15 25 20 16
16 30 24 20
17 35 28 23
18 40 33 28
19 46 38 32
20 52 43 38
En el SPSS…
Analizar  Pruebas no paramétricas  2 muestras relacionadas

Rangos

Rango Suma de
N promedio rangos
horas de sueño con Rangos a
8 6.31 50.50
el placebo - horas de negativos
sueño con la droga Rangos b
2 2.25 4.50
positivos
Empates 0c
Total 10
a. horas de sueño con el placebo < horas de sueño con la droga
b. horas de sueño con el placebo > horas de sueño con la droga
c. horas de sueño con el placebo = horas de sueño con la droga
En el SPSS…

Estadísticos de contrasteb

horas de sueño con el placebo


- horas de sueño con la droga
Z -2.346a
Asymp. Sig. (2-tailed) .019
a. Basado en los rangos positivos
b. Prueba de los rangos con signo de Wilcoxon
Prueba de la Suma de Rangos
de Wilcoxon
• Para comparar dos grupos
• Equivalente no paramétrico de la
prueba T.
• Consiste de 3 pasos básicos…
Paso 1
• Asignar rangos ascendentemente
para cada grupo
• Si se dan valores iguales promediar
sus rangos
Paso 2
• Sume los rangos en el grupo con el
tamaño de muestra más pequeño.
• Si los dos grupos tienen el mismo
tamaño, se debe elegir uno.
• W = suma de todos los rangos en el
grupo con el tamaño de muestra más
pequeño.
Paso 3
• Compare esta suma con el valor hallado en la
tabla de Wilcoxon.
• Hallar la fila correspondiente al tamaño del
grupo con la muestra más pequeña (n).
• Si el valor de W es menor que el hallado en la
tabla, se rechaza la hipótesis nula, es decir, hay
diferencias significativas.

Ho: No existen diferencias significativas entre


medias
Ha: Existen diferencias significativas entre medias
Ejempl
o
Se afirma que un estudiante universitario de último año
puede aumentar su calificación en el área del campo de
especialidad del examen de registro de graduados en al
menos 50 puntos si de antemano se le proporcionan
problemas de muestra. Para probar esta afirmación, se
dividen 20 estudiantes del último año en 10 pares de
modo que cada par tenga casi el mismo promedio de
puntos de calidad general en sus primeros años en la
universidad. Los problemas y respuestas de muestra se
proporcionan al azar a un miembro de cada par una
semana antes del examen. Se registran las siguientes
calificaciones del examen:
Pruebe la hipótesis nula en el nivel de significancia de 0.05 de que los
problemas aumentan las calificaciones en 50 puntos contra la hipótesis
alternativa de que el aumento es menor a 50 puntos.

Con problemas de Sin problemas de di di – d0


Par Rangos
muestra muestra
1 531 509 22 -28 5

2 621 540 81 31 6

3 663 688 -25 -75 9

4 579 502 77 27 3.5

5 451 424 27 -23 2

6 660 683 -23 -73 8

7 591 568 23 -27 3.5

8 719 748 -29 -79 10

9 543 530 13 -37 7

10 575 524 51 1 1
En este caso d0 = 50, por lo que se
procede a calcular las diferencias entre
las muestras y luego restarles el valor
de 50.

Para n=10 la tabla muestra que la región


crítica es w+ 11.

w+ = 6 + 3.5 + 1 = 10.5
• Decisión y Conclusión:

Como 10.5 es menor que 11 se


rechaza Ho y se concluye con un α
= 0.05 que los problemas de
muestra, en promedio, no
aumentan las calificaciones de
registro de graduados en 50
puntos.
La Prueba De WILCOXON Para
Muestras Grandes

n(n  1)
Estadístico Z W
z 4
n(n  1)(2n  1)
24

Media del w = n(n+1)


Estadístico 4

Cálculo del u =  n(n+1) (2n +1)


error 24
estándar
PRUEBA DE WILCOXON CON
MUESTRAS GRANDES
• Se debe de realizar una aproximacion a
la normal, con la media y la desviacion
tipica definida por las siguientes
expresiones:

= n(n + 1)
 
 En la expresion anterior n es el tamaño
de la muestra.
DESVIACION ESTANDAR

n(n  1)(2n  1)

24
A partir de las expresiones anteriores
deducimos la expresion para Z curva normal
tipificada para esta prueba y seria asi:
Valor tipificado

n(n  1)
W
z 4
n(n  1)(2n  1)
24
En los cursos que encuentra en los sitios
mencionados abajo encontrará mayor
información sobre estos temas.

[Link]/blog
[Link]

También podría gustarte