Está en la página 1de 6

PRUEBAS NO PARAMETRICAS PRTE 1

Hasta ahora hemos vistos en estadística inferencial paramétrica:


Cuando yo comparo promedios tengo varias opciones de comparación, puedo comparar
promedios para un promedio de importancia, puedo comparar 2 promedios entre sí, y esto
esta mediado por una prueba eje para definir si yo requiero usar varianzas homogéneas o
varianzas no homogéneas y, la tercera comparación que tenemos es un promedio de un antes
versus un promedio de un después y eso lo solucionamos con una T pareada.
Todas estas pruebas de comparación de promedios están basadas en unas distribuciones
paramétricas y usan pruebas T.

La ultima clase hablamos de modelos de regresión lineal que me permite predecir el


comportamiento de cualquier valor de la variable independiente en relación de la variable
dependiente y viceversa siempre y cuando tengan coeficientes de correlación buenos o
mayores de 0.6, es decir que yo podría por ejemplo asociar y predecir el comportamiento de
una variable dependiente en relación con la independiente siempre y cuando las 2 sean
cuantitativas continuas y muestren fuerte estrechez de asociación.
Ahora lo cierto es que a veces yo puedo tener consideraciones de más de una variable que yo
creo puedan afectar a una variable dependiente es decir varias variables independientes que
afecten a una variable dependiente, siempre y cuando la variable dependiente sea
cuantitativa.
Por ejemplo yo digo de que dependerá el peso de las personas: y alguien dice varios
determinantes que pueden afectar el peso como la edad, la talla y el sexo. Y yo quiero saber
que tanto se relacionan la variación que yo encuentro en peso con la variación que yo
encuentro en talla o que tanto se afecta el peso con la variación que obtenga de edad.
Pero además aparece una variable que no es la variable cuantitativa como es el sexo hombre
o mujer, entonces digo la condición de ser mujer determina más las variaciones de peso o al
revés pero con los hombres.
Y ahora como puedo resolver yo cuál de esas variables juegan dentro de sí para alterar la
condición de peso y entonces aparece algo que se llama Regresión Múltiple y esta tiene
varias consideraciones: yo tendré siempre la variable dependiente que esa si TIENE QUE SER
CUANTITATIVA y las independientes que quiero asociar pueden ser CUANTITATIVAS O
CUALITATIVAS. Las cuantitativas se trabajan obviamente como números y a las cualitativas
habitualmente se las dicotomisa por ejemplo al sexo 0 o 1.
Cuando yo hago un modelo de regresión múltiple voy a tener una pendiente y un valor de
corte en relación con cada una de las variables.
Ojo: mientras más variables meto en el modelo de regresión múltiple resulta que más grande
va a ser el r2 por eso es que los modelos de regresión múltiple deben ser muy bien pensados
para que no muestren información falsa.
Otro problema es que pueden darse como confusiones en las conclusiones del modelo de
regresión multiple cuando 2 variables de ahí están relacionadas y eso se llama colinealidad
Ejemplo la talla también se relaciona con la edad entonces debo decidir si le quito una o
quito otra o quito ambas, lo ideal es que yo deje una la que mi marco teórico diga que tiene
mayor peso sobre mi variable dependiente.
La idea es que debería evitarse la colinealidad en las variables independientes
Se debe entender que el r2 no necesariamente significa que la regresión es buenasa porque
mientras más variables estén formando parte de la regresión múltiple más grande va a ser
mi r2, por la misma razón a veces acompañan al r2 de un valor P y tampoco significa que la
P significativa diga de que la relación es buenasa porque mientras más variables están
acompañando al modelo de regresión es más probable que la P sea significativa entonces
les puede dar confusiones.

Como se controla las variables que tienen que entrar?


-Con la matriz de variables porque solo ingresan las variables que realmente determinan la
variable dependiente.

Pruebas No Paramétricas que van a reemplazar en el caso de las paramétricas a la prueba T


Se van a encontrar en la literatura de las pruebas no paramétricas que no deben usarse
cuando tienen n menor de 25 en la práctica se está usando habitualmente con n menor de
25.
La prueba del Signo
Cuando yo trabajo con pruebas no paramétricas trabajo con la mediana y entonces la prueba
del signo busca eso, un signo de frente a una mediana o un signo de frente a una variación.
Yo voy a partir de una hipótesis nula: la mediana A es igual a la mediana B y la hipótesis de
trabajo: la mediana A es diferente a la mediana B
Primera prueba No Paramétrica (prte 2)

La Prueba del Signo + y -

LA prueba del signo busca un signo de frente a una mediana o una variación

Vamos a partir de la hipótesis nula y de trabajo:

Ho: Med A= Med B / HT: Med A ≠ Med B

Estudio: Entrevistan a 10 parejas, hombres y mujeres, y les preguntan cuántos hijos quieren tener:

Personas Mujeres Hombres Diferencia


1 3 2 +1
2 2 3 -1
3 1 2 -1
4 0 2 -2
5 0 0 +0 esta es igualdad
6 1 2 -1
Signos positivos (+): 3
7 2 1 +1
…este es el signo menos frecuente
8 2 3 -1
9 2 1 +1 Signos negativos (-): 5
10 0 2 -2

Ho: Mujeres= Hombres / HT: Mujeres ≠ Hombres

Las hipótesis serian: la nula, que tanto hombres como mujeres quieren tener el mismo
número de hijos, y la de trabajo que no quieren el mismo número de hijos

Ahora vamos a la tabla de valores críticos:

Cuantos sujetos se estudiaron: α 0.05


10 1 (+): 3

LA HIPOTESIS NULA SE RECHAZA SI EL NUMERO DE VECES QUE SE REPITE EL SIGNO MENOS


FRECUENTE ES MENOR O IGUAL AL VALOR DE LA TABLA DE VALORES CRITICOS

CONCLUSION: Como el signo el número de veces del signo menos frecuente es en este caso mayor
al de la tabla, pues NO SE RECHAZA LA HIPOTESIS NULA.

Ho: Mujeres= Hombres ✔ / HT: Mujeres ≠ Hombres x

Ahora todo esto se parecería a una T de diferencia de promedios, estoy comparando la variación del
signo.
Otra aplicación del test del signo:

Supongamos que tenemos una población de sujetos A, luego de ser sometidos a un tratamiento de
quimioterapia, el tiempo de supervivencia de los manes fueron los siguientes:

La literatura dice que la mediana de supervivencia de esas personas es de 5 años.

Población A Diferencia con la mediana de 5 años:


10 +5
Signo positivo (+): 7
7 +2
5 0 Signo negativo (-): 2… este es
4 -1 el signo menos frecuente
3 -2
8 -3
9 +4
10 +5
11 +6
12 +7

Ho: T supervivencia= Mediana / HT: T supervivencia≠ Mediana

LA hipótesis nula seria el tiempo de supervivencia es igual o corresponde a la mediana de 5


años, y la hipótesis de trabajo es si es diferente a la mediana.

Vamos a la tabla de valores críticos:

Cuantos sujetos se estudiaron: α 0.05


(-): 2
10 1

LA HIPOTESIS NULA SE RECHAZA SI EL NUMERO DE VECES QUE SE REPITE EL SIGNO MENOS


FRECUENTE ES MENOR O IGUAL AL VALOR DE LA TABLA DE VALORES CRITICOS

CONCLUSION: Como el signo el número de veces del signo menos frecuente es en este caso mayor
al de la tabla, pues NO SE RECHAZA LA HIPOTESIS NULA.

Ho: T supervivencia= Mediana ✔ / HT: T supervivencia≠ Mediana x

El tiempo de supervivencia de la población a corresponde a la mediana de supervivencia reportada.

Realmente tiene como tres variantes mas, estas dos las más comunes.

LA usamos para comparar una mediana de referencia o para medir las variaciones entre dos
poblaciones sobre una variable cuantitativa discreta.

El test del signo tiene una variación adicional. Para poblaciones superiores a 25

Z: (x o valor de menos frecuencia + 0.05) – (n/2)

√n
Porque por 0.05 porque significa una probabilidad dicotómica.
TEST DEL RANGO DE WOLCOXON

Es parecido al test del signo, con una lógica igual. Pero con rangos
Supongamos que se evaluaron, el número de recidivas de una enfermedad con un fármaco
A y Fármaco B
Ho: Fármaco A= Fármaco B / HT: Fármaco A ≠ Fármaco B
Hipótesis que las medianas de recidivas va a ser igual en ambos grupos o diferentes para la
hipótesis de trabajo.
A 4 3 6 7 9 4 2 5
B 3 4 6 6 5 4 7 3
DIFEREN 1 -1 0 1 4 0 -5 2

1. Ordenar las diferencias en orden ascendente


2. Luego se les da un orden, un rango de orden de wilcoxon, los que son empates no
se les toma en cuenta.
3. Cuando hay diferencias que se repiten se llaman LIGUES, para unir el ligue, uso el
promedio del rango asignado (1+2+3=6 / 3 = 2), y ese rango de 2 voy a usar para los
ligues.

Diferencias Rangos Rango


en orden orden asignado
ascendente
0 - -
0 - -
1 1 2
1 2 2
1 3 2
2 4 4
4 5 5
5 6 6

A 4 3 6 7 9 4 2 5
B 3 4 6 6 5 4 7 3
DIFEREN 1 -1 0 1 4 0 -5 2
RANGO 2 2 - 2 5 - 6 4
ASIGNADO

Luego sumamos todos los de signo positivo:


Signo positivo (+): 13
Signo negativo (-): 8
Para tomar la decisión: El valor más bajo, de los rangos positivos y negativos, en este caso
el 8, y con ese se hace el contraste. Con la tabla de contraste de Wilcoxon.
Valores útiles (sin empates) α 0.05
6 0-21 (-):8

Si es que esta entre 0 y 21, voy a aceptar la hipótesis nula, sino rechazo la hipótesis nula.

Ho: Fármaco A= Fármaco B ✔ / HT: Fármaco A ≠ Fármaco B x

Acepto la hipótesis nula, donde dice que el número de recidivas con el fármaco A es igual al
número de recidivas con el fármaco B.

Yo puedo usar el test de signo para comparar dos grupos, igualmente el test de rangos de
wilcoxon.

En realidad el test de rango se usa habitualmente para análisis pareados, ósea es el


reemplazo para la t pareada porque se basa en las diferencias.

Conclusion: El test de signo y rangos trabajan sobre MEDIANAS.

También podría gustarte