Está en la página 1de 5

Ejercicios resueltos de Métodos no paramétricos

1. Una agencia publicitaria está investigando a qué tipo de avisos le prestan más atención los
adolescentes. Se observan a 11 niños, a 6 se les muestra avisos sobre comida y a los 5 restantes se
les muestra avisos sobre bebidas. Todos los avisos tienen duración similar. Se registra el tiempo de
atención (en segundos) de los 11 niños.
a) Establezca las hipótesis de interés

Solución:
La agencia está explorando acerca de la duración de la atención de los
adolescentes y quiere saber a qué tipo de avisos le prestan más atención, pero
no tenemos ninguna información a priori sobre cuál de los dos tipos de avisos
son los preferidos, por lo tanto planteamos la hipótesis bilateral y le podremos
contestar a agencia si hay o no diferencias entre ellos.

Ho: la distribución del tiempo de atención que prestan los adolescentes a avisos
sobre comida es igual a la distribución de los avisos de bebidas

H1: la distribución del tiempo de atención que prestan los adolescentes a avisos
sobre comida es distinta a la distribución de los avisos de bebidas
o
Ho: mediana del tiempo de atención que prestan los adolescentes a avisos
sobre comida es igual a la mediana de los avisos de bebidas

H1: mediana del tiempo de atención que prestan los adolescentes a avisos
sobre comida es distinta a la mediana de los avisos de bebidas
b) Use la salida de SPSS para reproducir lo que pueda de los cálculos que hace SPSS.

Estadísticos de contrasteb

TIEMPO
U de Mann-Whitney 4.000
W de Wilcoxon 19.000
Z -2.008
Sig. asintót. (bilateral) .045
Sig. exacta [2*(Sig. a
.052
unilateral)]
a. No corregidos para los empates.
b. Variable de agrupación: AVISOS

Solución:
Para docimar la hipótesis de interés usamos el test de Wilcoxon para muestras
independientes es decir el "Test de suma de rangos de Wilcoxon".
Primero ordenamos los datos, sin importar el grupo:

Tipo aviso B C B B B B C C C C C
Datos ordenados 23 25 28 30 35 38 41 42 45 47 50
Rangos 1 2 3 4 5 6 7 8 9 10 11

Suma
Rangos Comida 2 7 8 9 10 11 47
Rangos Bebidas 1 3 4 5 6 19
66

SPSS considera el estadístico W de Wilcoxon, a la suma menor de los rangos


en este caso 19 que corresponde a la suma de los rangos de las bebidas.

Es test estadístico aproximado Z se construye a partir de W, la media y la


desviación estándar:

5 × 12 5 × 6 × 12
Media: µW = = 30 Desviación estándar: σ W = = 5,477
2 12

19 − 30
Test Z aproximado: z = = −2,008
5,477

El resultado es igual al de la tabla ya que en este caso no hay empates y no es


necesario hacer corrección.

La sig. asintótica (bilateral ) es el valor p bilateral aproximado 0,045 y sale de


las tablas de la distribución normal.

La sig. exacta 0,052 es el valor p para el test exacto que propuso Wilcoxon.

c) Explique el origen de los dos valores p que da SPSS. ¿Cuál se prefiere?

La “sig. asintótica (bilateral )” es el valor p bilateral aproximado 0,045 y sale de


las tablas de la distribución normal.

La “sig. exacta" 0,052 es el valor p para el test exacto que propuso Wilcoxon
originalmente.

La aproximación Normal funciona bien si el tamaño de la muestra es grande,


pero en general los métodos no paramétricos son usados para tamaños
muestrales pequeños.
En general, vamos a preferir el valor p exacto si es posible obtenerlo. Si no es
posible, usamos el valor p aproximado y esperamos que los dos nos lleven a la
misma conclusión. Lo que NO ocurre en este caso!

d) Informe su análisis y conclusión a la agencia publicitaria.

Solución:
Para docimar la hipótesis en (a) usamos el test de suma de rangos de Wilcoxon
(test para muestras independientes).

Para resolver el test nos basamos en la distribución exacta del estadístico


W=19, la tabla del SPSS nos da un valor p de 0,052

Este valor p es mayor que el nivel de significancia 0,05 por lo tanto aceptamos
Ho y concluimos que no tenemos suficiente evidencia para decir que hay
diferencias significativas en la atención de avisos publicitarios.

Informe a la agencia publicitaria:

El análisis a los datos por ustedes aportados, nos dicen que con un nivel de
significancia del 5%, que NO tenemos suficiente evidencia para concluir que
existen diferencias significativas en el tiempo de atención de avisos publicitarios
por los adolescentes.
2. Tres vecinos discuten acerca que cual de sus perros corre más rápido y deciden hacer un pequeño
experimento. Cada perro corre una pequeña distancia 3 veces. Se registran los tiempos que demoran
los perros en correr en segundos:
a) Establezca las hipótesis de interés

Solución:
Se tienen 3 grupos independientes.
Ho: la distribución de los tiempos de los tres perros es igual.

H1: la distribución de los tiempos de al menos uno de los perros es distinta.


o
Ho: las medianas de los tiempos de los tres perros es igual.

H1: la mediana de los tiempos de al menos uno de los perros es distinta.


b) Use la salida de SPSS para reproducir lo que pueda de los cálculos que hace SPSS.

Solución:
En este caso el test apropiado para docimar la hipótesis de interés es el test de
Kruskal-Wallis.
Para llevar a cabo el test, tenemos que ordenar todos los datos y calcular los
rangos.
Datos ordenados 9 9 10 12 13 13 13 14 15
Orden 1 2 3 4 5 6 7 8 9
Rangos 1,5 1,5 3 4 6 6 6 8 9

Rangos Suma Rango promedio


Cachupín 6 4 6 16 16/3 = 5,333
Rufo 1,5 3 1,5 6 6/3 = 2,0
Capitán 6 9 8 23 23/3 = 7,67
Total 45

Con estos datos podemos calcular el estadístico H:


12  16 2 6 2 232 
H=  + +  − 3 × 10 ~ χ 2 (2)
9 × 10  3 3 3 
H = 6,489

En la salida H=6,771, esta diferencia se produce por la corrección por empates.


Este estadístico tiene una distribución aproximada de Ji cuadrado con dos
(número de grupos menos uno) grados de libertad. El valor p aproximado (para
la hipótesis bilateral) se saca de las tablas de la distribución de Ji cuadrado.

c) Informe su análisis y conclusión a los vecinos.

Solución:
Informe de análisis:

Para resolver la hipótesis planteada en (a) usamos el Test no paramétrico de


Kruskal-Wallis que se basa en el estadístico H=6,771 con 2 grados de libertad.
Este estadístico tiene un valor-p aproximado de 0,034.

Como el valor p es menor que el nivel de significancia de 0,05, rechazamos la


hipótesis nula y concluimos, con un nivel del 5%, que existen diferencias
significativas en las medianas del tiempo que demoran los perros.

Ahora a los vecinos además les interesará saber cuál es la diferencia entre los
perros.

Para eso usamos el test de Tukey en los rangos de la variable tiempo. Los
resultados nos dicen que el Perro que corre más rápido es Rufo y esta
diferencia es significativamente distinta de los tiempos de Cachupín y de
Capitán.

En cambio los tiempos de Cachupín y Capitán no son estadísticamente


diferentes.
Estadísticos de contrastea,b
Rangos
TIEMPO
Rango Chi-cuadrado 6.771
PERROS N promedio
gl 2
TIEMPO Cachupín 3 5.33
Sig. asintót. .034
Rufo 3 2.00
Capitán 3 7.67 a. Prueba de Kruskal-Wallis
Total 9 b. Variable de agrupación: PERROS

También podría gustarte