Está en la página 1de 171

TABLAS ESTADISTICAS

PRUEBAS NO
PARAMETRICAS

Med. Bernardo C. DAMASO MATA


ESTADISTICAS NO PARAMETRICAS

Estadsticas paramtricas:

El objetivo consiste en estimar o probar una hiptesis acerca de uno o mas


parmetros de la poblacin.
El elemento fundamental de estos procedimientos fue el conocimiento de la
forma funcional de la distribucin de la poblacin de la cual se extrajeron
las muestras que proporcionaron la base para la inferencia.
La poblacin o poblaciones de donde proceden las muestras tienen, al menos,
una distribucin aproximadamente normal.
ESTADISTICAS NO PARAMETRICAS

Estadsticas no paramtricas:

No se centran en parmetros de la poblacin, ni del conocimiento de las


caractersticas de la poblacin de donde se extraen las muestras.

Solo aquello procedimientos que prueban hiptesis que no son afirmaciones


acerca de los parmetros de la poblacin, se clasifican como no
paramtricas.

Aquellos procedimientos que no hacen suposicin alguna acerca de la


poblacin de la cual se extraen la muestra, se conocen como de libre
distribucin.
ESTADISTICAS NO PARAMETRICAS

Estadsticas no paramtricas

Ventajas:

1. Permiten la prueba de hiptesis que no son afirmaciones acerca de los


valores de los parmetros de la poblacin.
2. Pueden utilizarse cuando se desconoce la distribucin de la poblacin de
la cual se extraen las muestras.
3. Son mas fciles de calcular, aplicndose con mayor rapidez.
4. Se aplica cuando los datos que sirven para el anlisis constan
simplemente de categoras o clasificaciones.
ESTADISTICAS NO PARAMETRICAS

Estadsticas no paramtricas

Desventajas:

1. El uso de procedimientos no paramtricos con datos que pueden


manejarse con un procedimiento paramtrico produce un desperdicio de
informacin.
2. La aplicacin de algunas de las pruebas no paramtricas puede ser muy
laboriosa para muestras grandes.
ESTADISTICAS NO PARAMETRICAS

METODOS NO PARAMETRICOS
Si las poblaciones fuente de los datos se encuentran normalmente distribudas,(criterios de normalidad y
homocedasticidad) se usan PRUEBAS PARAMETRICAS
Si las poblaciones fuente de los datos NO se encuentran normalmente distribudas se usan TECNICAS NO
PARAMETRICAS. ( Mtodos libre de distribucin).
ESTADISTICAS NO PARAMETRICAS

VENTAJAS DE LOS METODOS NO PARAMETRICOS


1. No incorporan todas las asunciones restrictivas caractersticas de los test paramtricos
2. No requieren que la poblacin subyacente este normalmente distribudo, al menos las poblaciones
deberan tener la misma forma bsica
3. Tratan con rangos mas que valores propios de las observaciones, facilmente se ejecutan
para muestras pequeas.
4. El uso de rangos permiten menos errores, y permiten el uso de mediciones ordinales mas que contnuas
5. No tiene sentido calcular medias y DE para los datos ordinales.

DESVENTAJAS DE LOS METODOS NO PARAMETRICOS


1. Si las asunciones subyacentes de un test paramtrico son satisfechas, entonces las pruebas no paramtricas
tienen menos poder, por ejemplo si la Ho es falsa, las pruebas no paramtricas necesitan muestras
mas grandes para rechazarlos.
2. Las hiptesis probadas por tcnicas no paramtricas son menos especficas que aquellos
probadas por metodos paramtricos.
3. Las tcnicas no paramtricas confian mas en los rangos mas que valores propios de las observaciones,
por lo tanto no usaran toda la informacin conocida acerca de una distribucin.
4. Si una gran proporcin de observaciones estan empatadas, entonces Q t y Qw sobrestiman la DE de T y W.
ESTADISTICAS NO PARAMETRICAS

El Test de signos (Sign Test)


Compara muestras de observaciones cuando la poblacin de donde provienen
NO SON INDEPENDIENTES.
Es similar a t-test apareado.
Bsicamente examina la diferencia de valores en cada pareja.
Test de hiptesis:
Ho: La mediana de la diferencias entre parejas en la poblacin subyacente es = 0
ESTADISTICAS NO PARAMETRICAS
Ejemplo:
TABLA 13.1
GASTO DE ENERGIA EN REPOSO (GER) ( PARA PACIENTES CON
FIBROSIS QUISTICA Y PACIENTES SANOS. APAREADOS POR
EDAD, SEXO, TALLA Y PESO.

GER (Kcal / d)
PAREJA FQ SANOS DIFERENCIA SIGNOS
1 1153 996 157 +
2 1132 1080 52 +
3 1165 1182 -17 -
4 1460 1452 8 +
5 1634 1162 472 +
6 1493 1619 -126 -
7 1358 1140 218 +
8 1453 1123 330 +
9 1185 1113 72 +
10 1824 1463 361 +
11 1793 1632 161 +
12 1930 1614 316 +
13 2075 1836 239 +

D= Total de signos positivos


Si Ho = Medianas de las diferencias = 0. Entonces se espera tener igual nmeros de signos + y -
n es una variable random de distribucin binomial con valores (+) y(-)
Si el signo positivo es considerado como "resultado xito". Entonces la probabilidad de
xito sera p = 1/2.
La media de signos positivos ser: np =n/2
La Desviacin estndar = Raiz de np(1-p) = Raiz n/4
Cuando el tamao de la muestra n es bastante grande entonces;
z+ sigue una distribucin normal con media de 0 y DE de 1 (curva standard normal)
ESTADISTICAS NO PARAMETRICAS
Z+ =D - (n/2) / raiz(n/4)

En la tabla 13.1:
D = 11
n/2 = 13/2 = 6.5
Raiz n/4 = Raiz de 13/4 = 1.80
Por lo tanto:
Z+ = 11-6.5 / 1.80 = 2.50

El area a la derecha bajo la curva standard normal es z = 2.50 y a la izquierda de z = -2.50 es p =2( 0.006) = 0.012
Por lo tanto p<0.05 y nosotros rechazamos la Ho y conclumos que las medianas de las diferencias
entre las parejas no es igual a cero.

Cuando el tamao de la muestra n es bastante pequea ( mas o menos 20) entonces;


D=variable aleatoria binomial
Parmetros: n y p = 1/2
Usaremos la distribucin binomial para calcular la probabilidad de observar diferencias D positivas
D = 11 signos positivos
Ho = Medianas de las diferencias es cero (deberamos esperar que sean unicamente 6.5 signos positivos)
La probabilidad de esperar 11 o ms signos positivos =
P(D>=11) = P(D=11) + P(D = 12) + P(D = 13)

P(X =x) = (n x)px(1 - p)n-x p = 0.5; n = 13

=(1311)(0.5)11(0.5)13-11 + (1312)(0.5)12(0.5)13-12 +(1313)(0.5)13(0.5)13-13 = 0.0095 + 0.0016 + 0.0001 = 0.0112

Como es un test de hiptesis bidireccional entonces el valor de p= 2 (0.0112) = 0.0224.


El gasto de energa es mas alto durante el reposo en pacientes con FQ.
ESTADISTICAS NO PARAMETRICAS

EL TEST DE WILCOXON SIGNED RANK TEST (prueba de rangos con signo de wilcoxon).
Compara dos muestras de poblaciones que no son independientes
Toma en cuenta la diferencia de valores para cada uno de las parejas de observaciones.,
es decir toma en cuenta la magnitud de las diferencias y sus signos.
Ho = La mediana de las diferencias entre parejas es igual a cero
ESTADISTICAS NO PARAMETRICAS
REDUCCION DE LA CAPACIDAD VITAL FORZADA DE UNA
MUESTRA DE PACIENTES CON FIBROSIS QUISTICA

REDUCCION DE LA CVF RANK DE


SUJETO PLACEBO DROGA DIFERENCIA RANKING SIGNOS
1 224 213 11 1
2 80 95 -15 -2
3 75 33 42 3
4 541 440 101 4
5 74 -32 106 5
6 85 -28 113 6
7 293 445 -152 -7
8 -23 -178 155 8
9 525 367 158 9
10 -38 140 -178 -10
11 508 323 185 11
12 255 10 245 12
13 525 65 460 13
14 1023 343 680 14
Suma de los ranks positivos y negativos 86 -19

T = suma ms pequea
Ho = Las medianas de las diferencias debe ser 0 (igual nmero de ranks positivos y negativos)
y la suma de los ranks positivos debe ser igual a la suma de los ranks negativos.

T = Suma ms pequea
Cuando el tamao de la muestra es grande
ESTADISTICAS NO PARAMETRICAS
T = suma ms pequea
Ho = Las medianas de las diferencias debe ser 0 (igual nmero de ranks positivos y negativos)
y la suma de los ranks positivos debe ser igual a la suma de los ranks negativos.

T = Suma ms pequea
Cuando el tamao de la muestra es grande
Z t = T - uT / QT

U T = n(n + 1) / 4 Ut = promedio de la suma de los rangos

Q T = raiz n(n+1)(2n+1) / 24 Qt= Es la desviacin estndar.

U T = 14(14 + 1) / 4 = 52.5

Q T = raiz 14 (14 + 1) (2 (14) +1 ) / 24 = 15.93

Z t = 19 - 52.5 / 15.93 = -2.10

El area bajo la curva a la izquierda de z = -2.10 y a la derecha de z = 2.10 es 2 (0.018) = 0.036


Nosostros rechazamos la Ho y conclumos que la medianas de la diferencias no es igual a cero.
Muchas diferencias son positivas, por lo tanto la reduccin de la capacidad vital es mayor
durante el tratamiento con placebo.

Si el tamao muestral es pequeo:


Usar tablas para determinar si se rechaza o no la Ho: (ver tabla A.6) Pagano
Solo es vlido para n< de 30
T0 es mostrado en la columna izquierda
El n o tamao de la muestra en la primera fila.
Para cada combinacin de T0 y n los valores de la tabla representan la probabilidad que T es menor que
o igual a T0
ESTADISTICAS NO PARAMETRICAS

WILCOXON RANK SUM TEST (Prueba de la suma de Rangos de Wilcoxon).


Compara dos muestras que han sido extradas de de poblaciones independientes
Contraparte de t-test
No requiere que las poblacin subyacente este normalmente distribudos, o que sus varianzas sean iguales.
Ho = Las medianas de las dos poblaciones son iguales
Md1 =Md2
Md1-Md2 = 0
ESTADISTICAS NO PARAMETRICAS
TABLA 13.3
SCORE DE EDAD MENTAL NORMALIZADO PARA DOS MUESTRAS DE NIOS
QUE SUFREN DE FENIALANINEMIA
BAJA ALTA
EXPOSICION (<10.0 m g/dl) EXPOSICION (<10.0 m g/dl)
nMA(mos) Rank nMA(mos) Rank
34,5 2,0 28 1
37,5 6,0 35 3
39,5 7,0 37 4,5
40 8 37 4,5
45,5 11,5 43,5 9
47 14,5 44 10
47 14,5 45,5 11,5
47,5 16 46 13
48,7 19,5 48 17
49 21 48,3 18
51 23 48,7 19,5
51 23 51 23
52 25,5 52 25,5
53 28 53 28
54 31,5 53 28
54 31,5 54 31,5
55 34,5 54 31,5
56,5 36 55 34,5
57 37 suma 313
58,5 38,5
58,5 38,5
suma 467
ESTADISTICAS NO PARAMETRICAS
Deseamos determinar si la mediana normalizada del score de edad mental de las dos poblaciones
de nios son idnticos.
1. Ordenar todas las observaciones de el ms pequeo al mas grande y asignar un rango a cada uno.
2. En las observaciones empatadas asignar un rango promedio
3. Sumar los rangos de cada grupo
La suma ms pequea de los dos grupos se denota como: W
La Ho = las dos poblaciones tienen medianas idnticas y los rangos estaran distribuidos aleatoriamente
entre ambos grupos. Y los rangos promedios de cada muestra deberan ser aproximadamente iguales.

Z w = W -u w / Q w

u w = n s (n s + n L +1) / 2 (Promedio de la suma de los rangos).

Q w = RAIZ n s n L (n s + n L +1) / 12 (desviacin estndar de W).


ns = nmero de observaciones en la muestra que tiene la suma mas pequea de rangos
nL = nmero de observaciones en la muestra con la suma ms grande
Para muestras de gran tamao ns y nL siguen una distribucin normal con media de 0 y una DE de 1
En el ejemplo:
W = 313
ns = 18
nL = 21
Uw = 18(18+21+1) / 2 = 360
Qw = raiz (18*21(18+21+1) / 12 = 35.5
Zw = W - Uw / Qw = - 1.32
p = 2 (0.093) = 0.186;
0.186 es m ayor de 0.05, NO SE RECHAZA LA Ho

CONCLUSION: Los nios con mas alta exposicin de fenialanina han alcanzado un nivel de
de funcionamiento mental que es comparable con el nivel de nios con baja exposicin.
ESTADISTICAS NO PARAMETRICAS

Para muestras con ns y nL pequeos, Zw no sigue una distribucin normal.


Tabla A-7. Muestra la distribucin de funciones de sumas pequeas de rangos (W),
para muestras de tamao ns y nL menores de 10.
n2 = es el tamao de la muestra ms grande y n1 es el ms pequeo.
Si ns = 5 y nL = 4
n1 = 4 y n2 = 5
La probabilidad que W sea menor o igual a 13 es = 0.0556
Test bidireccional = 2 (0.0556) = 0.1112

El Wilcoxon rank-sum test algunas veces es referido en la literatura como Mann Whitney U test.
la prueba estadstica de Mann Whitney U test esta basado en el nmero de parejas de
observaciones (xi, yj), una de cada muestra, tal que xi<yj
La prueba de Mann Whitney U test y la prueba de Wilcoxon-rank sum test son
completamente equivalentes.
ESTADISTICAS NO PARAMETRICAS

TEST DE KRUSKAL WALLIS


En algunos casos nosotros deseamos comparar las medias entre ms de dos muestras,
pero la distribucin subyacente est lejos de ser normal o nosotros tenemos datos ordinales
PARA LOGRAR ESTE OBJETIVO LAS OBSERVACIONES EN TODOS LOS GRUPOS DEL TRATAMIENTO
SE AGRUPAN Y SE ASIGNAN RANGOS A CADA OBSERVACIN DE LA MUESTRA COMBINADA

INDOMETACINA ASPIRINA PIROXICAM BW755


RATONES SCORE RANK SCORE RANK SCORE RANKS SCROE RANKS
1 2 13,5 1 9,0 3 20,0 1 9,0
2 3 20,0 3 20,0 1 9,0 0 4,0
3 3 20,0 1 9,0 2 13,5 0 4,0
4 3 20,0 2 13,5 1 9,0 0 4,0
5 3 20,0 2 13,5 3 20,0 0 4,0
6 0 4,0 3 20,0 3 20,0 -1 1,0

Los rangos promedios de cada grupo son comparados.


Si los rangos promedios estan cercanos entre si, entonces la Ho de que los tratamientos son igualmente
efectivos entre si, debe ser aceptado.
Si los rangos promedios son de lejos diferentes, enonces la Ho debe ser rechazado y concluir que al menos
algunos de los tratamientos son diferentes.
ESTADISTICAS NO PARAMETRICAS

RESUMEN DE LAS PRUEBAS PARAMETRICAS MAS IMPORTANTES


METODO NO PARAMETRICO USO EQUIVALENTE PARAMETRICO
Sign test Forma simplificada de
Wilcoxon rank test
Wilcoxon signed rank test La prueba de diferencias entre T-test apareado
las observaciones apareadas
Wilcoxon rank sum test Comparacion de dos grupos t-test de dos muestras

Mann Whitney U test Alternativa a Wilcoxon rank sum t-test de dos muestras
Kendalls S test test, y da identicos resultados t-test de dos muestras
Kruskall Wallis, one w ay analysis Comparacin de varios grupos One-w ay analysis of variance
of variance
Friedman tw o w ay analysis Comparacin de grupos, definido Tw o w ay analysis of variance
of variance por sus valores en dos variables
Spearmans rank correlation Medida de asociacin entre Coefficiente de correlacin
dos variables contnuas
Kendalls rank correlation Alternativa a Spearmans rank Coefficiente de correlacin
correlation
X2 goodness of fit test Compara la distribucion de una frec
observada con un modelo terico
Kolmogorov-Smirnov test Alternativa a X2 goodness of fit test
One sample-Tw o sample Compara distribucin de dos frec
PRUEBA DE RANGOS CON SIGNOS
DE WILCOXON
PRUEBA DE LA SUMA RANGOS DE
WILCOXON
ANALISIS DE DATOS DISCRETOS o
NOMINALES
PRUEBA DE CHI CUADRADO
TABLAS DE CONTINGENCIA
TABLAS DE X2 CUANDO LAS TABLAS
SON MAS GRANDES QUE 2x2
CORRECCION CUANDO LOS
TAMAOS DE MUESTRA SON MUY
PEQUEOS
PRUEBA EXACTA DE FISHER
DISTRIBUCION DE FISHER

Definicin. Una variable aleatoria se distribuye segn el modelo de


probabilidad F de Fisher con (m,n) grados de libertad , donde m y n son
enteros positivos, si su funcin de densidad es la siguiente :
DISTRIBUCION DE FISHER

La grfica de esta funcin de densidad se presenta a continuacin para (10,8)


grados de libertad:
DISTRIBUCION DE FISHER

El modelo de probabilidad del cociente entre varianzas muestrales,


en poblaciones normales e independientes. Si X1, X2, ..., Xm ; e Y1, Y2,
..., Yn son muestras aleatorias de tamaos m y n extradas de poblaciones
normales N(x, sx) y N(y, sy) , respectivamente, entonces
MUESTRAS APAREADAS
(PRUEBA Mc NEMAR)
LISTADO DE COMPUTADOR PARA
LA PRUEBA DEL x2

También podría gustarte