Está en la página 1de 13

Inferencia Estadística ‒ Licenciatura en Economía (FCE-UNNE)

Unidad 4: Tests estadísticos no paramétricos


1. Fundamentos de la inferencia estadística no paramétrica
Los tests de hipótesis estadísticas que hemos analizado en el capítulo anterior del programa de la
asignatura exigen para su correcta aplicación uno o más requisitos previos que en caso de no cumplirse
podrían dar lugar a resultados e interpretaciones erróneas.
En efecto, algunos de estos supuestos básicos o requisitos previos pueden ser:
 La/s muestra/s procede/n de poblaciones en las que la/s variable/s se distribuyen según una ley normal u
otra forma específica.
 Las variancias en ambas poblaciones no difieren significativamente (homocedasticidad).
 Alguna/s variable/s está/n medida/s en una escala de intervalo o razón.
El conjunto de pruebas oportunamente estudiadas (Unidad 3: Tests de hipótesis), que por cierto
contemplan las exigencias previas descriptas, reciben el nombre genérico de pruebas paramétricas.
Sin embargo, suceden distintas situaciones en las que debemos trabajar con una muestra: a) muy
reducida de datos, b) los mismos no siguen una distribución determinada, c) las variancias difieren de
manera significativa, d) las variables están medidas en una escala ordinal, etcétera. Es precisamente en
estos casos cuando debemos utilizar las que genéricamente reciben el nombre de pruebas no paramé-
tricas, las cuales no se basan en supuestos tan restrictivos como los mencionados anteriormente.
El origen de estas pruebas es más reciente que el de los tests o contrastes paramétricos, tienen al-
gunas ventajas (no requieren el supuesto de que la población de la cual se extrae la muestra esté distri-
buida en una forma determinada, suelen ser más sencillas de implementarlas y entenderlas, no necesi-
tan trabajar con datos obtenidos con una escala de intervalo o razón) respecto de las últimas aunque en
general poseen menor potencia probatoria.
Comenzaremos por desarrollar en forma eminentemente práctica, con ayuda del programa IBM
SPSS Statistics 26, el siguiente test para una sola muestra.

2.1 Prueba Chi-cuadrado para una muestra


El objetivo de esta prueba reside en comparar, a través del estadístico χ2, las posibles diferencias
entre las frecuencias observadas en una distribución de una variable y las esperadas en razón de una
determinada hipótesis. Es decir, permite comprobar el ajuste de la distribución de frecuencias de una
variable discreta a una distribución teórica.
Luego de abrir SPSS, se carga el archivo benefici.sav (contiene datos de beneficios de una serie de
empresas españolas que cotizaban en bolsa).
Descripción general (benefici.sav): Datos referidos a las ventas y beneficios de los años A y B de las
principales empresas españolas que cotizaban en bolsa (excluidos los bancos) y de los diversos sectores
de la actividad industrial. Los datos contienen valores en euros correspondientes a 83 empresas.

Variable Descripción Codificación de la variable Sector


Sector Sector de actividad 1 Alimentarias
Empresa Nombre de la empresa 2 Automóviles
Bai_A Beneficios antes de impuestos año A 3 Cemento y construcción
4 Comercio y varios
Ventas_A Ventas año A
5 Constructoras
Bai_B Beneficios antes de impuestos año B
6 Eléctricas
Ventas_B Ventas año B
7 Inmobiliarias
8 Maq. electrónica e ingeniería
9 Químicas
10 Servicios públicos
11 Siderurgia y metalurgias
12 Textil y papeleras
Posteriormente se selecciona la opción Analizar > Pruebas no paramétricas > Cuadros de diálogo
antiguos > Chi-cuadrado…, luego de esta secuencia se accede al cuadro de diálogo Prueba de Chi-
cuadrado que se muestra en la Figura 1.

Figura 1. Cuadro de diálogo Prueba de Chi-cuadrado

Se ingresa Sector (variable nominal) en Lista Variables de prueba y se deja el resto de opciones por
defecto. Se ejecuta el procedimiento, obteniéndose la salida de la Figura 2. La intención en este ejem-
plo es averiguar si las frecuencias de las categorías de la variable Sector se ajustan a una distribución
uniforme.

Requisitos para emplear la prueba de


bondad de ajuste con distribución χ2:
 Mínimo de 50 observaciones.
 Frecuencia esperada para cada
categoría debe ser mínimo 5.

Figura 2. Resultados del test Chi-cuadrado de comparación

Se puede observar en estos resultados que en el archivo benefici.sav las 83 empresas de la muestra
están distribuidas por sectores de acuerdo con las frecuencias observadas que aparecen en la columna
correspondiente (N observado); es decir, 7 de alimentación, 2 de automoción, 8 de cementos y construc-
toras, etc. A continuación aparece la columna con las frecuencias esperadas (N esperada), que en este
caso y puesto que la opción seleccionada en el cuadro de diálogo de la Figura 1 para Valores esperados
ha sido Todas las categorías iguales, es un simple cociente entre el total de la muestra (N = 83) y el
número de categorías de la variable (K = 12). Equivale a efectuar el ajuste a una distribución uniforme.
Los residuos son las diferencias entre unas y otras, frecuencias observadas y frecuencias esperadas.

El valor χ2 se obtiene mediante la ecuación: 2  


K
Foi  Fei 2
i 1 Fei
Foi: frecuencias observadas, Fei: frecuencias esperadas, K: número de categorías de la variable.

En el ejemplo dado:  2  0.1   4.9  1.1    0.1  7.361


2 2 2 2

6.9 6.9 6.9 6.9


Los grados de libertad (gl) resultan igual al número de categorías de la variable menos 1, en este
caso, K ‒ 1 = 11 y el grado de significación del estadístico χ2 es igual a 0.769 (valor p). Con un riesgo
de α = 5% esto nos llevará a no rechazar la hipótesis nula (H0) y que en este ejemplo estaría planteada
en términos de que el número de empresas de la muestra para cada uno de los 12 sectores representa-
dos en la misma no es estadísticamente diferente (frecuencias esperadas). En otras palabras, no hay
evidencia suficiente para rechazar la hipótesis de bondad de ajuste y, en consecuencia, se puede con-
cluir que la variable Sector se ajusta a una distribución uniforme.
Estas frecuencias esperadas siempre corresponderán a las que debería tener la tabla en el supuesto
de cumplirse la H0, que en esta prueba hace referencia a un problema de comparación entre dos distri-
buciones (observada y esperada).

2.2 Prueba de Kolmogorov-Smirnov para una muestra


El test de Kolmogorov-Smirnov se utiliza para determinar el grado de ajuste de unos datos a una
distribución normal, uniforme, de Poisson o exponencial. Se basa en las diferencias de porcentajes
entre la distribución acumulada observada y estos mismos porcentajes para la función de distribución
acumulada teórica y que puede ser alguna de las mencionadas.
La hipótesis nula (H0) se plantea en términos de que la muestra procede de una población en la que
la variable sigue o se ajusta a una de las distribuciones con nombre propio señaladas, en tanto que la
hipótesis alternativa, que no es así; es decir, que los datos empíricos u observados no se ajustan a una u
otra de las cuatro distribuciones indicadas.
En Argentina, como en muchos otros países, la industria automotriz es un sector estratégico para el
desarrollo y el crecimiento económico. El complejo automotriz y autopartista genera en nuestro país
125.000 empleos, representa 6.6% del PIB industrial y exporta a 43 países por un total de US$ 4.275
millones anuales.
En virtud del impacto que en general tiene esta área en la economía de los países es que en esta
ocasión utilizaremos la variable Consurb del archivo tterreno.sav, el cual contiene las características
técnicas de algunos vehículos todo terreno.
Descripción general (tterreno.sav): Datos referidos a los vehículos todo terreno que se comerciali-
zan en un cierto país y en un determinado año. El archivo contiene variables que recogen datos sobre
características técnicas y precios de venta al público, las que se encuentran a continuación, que fueron
extraídas de publicaciones especializadas del mercado automotriz. En total la muestra se encuentra
conformada por 125 vehículos diferentes.

Variable Descripción
Marca Marca del vehículo
Modelo Modelo del vehículo
Pvp Precio venta público
Cilindro Número de cilindros
Cc Cilindrada en cm3
Potencia Potencia en CV
Rpm Revoluciones por minuto
Peso Peso en kg
Plazas Número de plazas
Cons90 Consumo en litros a 90 km/hora
Cons120 Consumo en litros a 120 km/hora
Consurb Consumo en litros en recorrido urbano
Velocidad Velocidad máxima
Acelerac Aceleración en segundos de 0 a 100 km/hora
Luego de abierto el programa SPSS y cargado el archivo tterreno.sav, se selecciona la opción Anali-
zar > Pruebas no paramétricas > Cuadros de diálogo antiguos > K-S de 1 muestra… Posteriormente de
esta secuencia se ingresa Consurb (variable continua) en Lista Variables de prueba y se deja el resto de
opciones por defecto. Resulta el cuadro de diálogo Prueba de Kolmogorov-Smirnov para una muestra
que se observa en la Figura 3.

Figura 3. Cuadro de diálogo de la Prueba K-S

Al ejecuta el procedimiento, se obtienen los resultados que pueden apreciarse en la Figura 4.

Figura 4. Resultados del test K-S para una muestra

De acuerdo con la salida proporcionada por SPSS 26, de los 125 vehículos que forman la muestra,
solo 118 poseen puntuaciones en la variable Consurb, de los 7 restantes no se dispone de esta informa-
ción.
En virtud de que el estadístico de prueba Z = 0.134 tiene asociado un grado de significación igual a
0.000 (valor p), con un riesgo de α = 0.05 debemos rechazar la hipótesis nula (H0) de que los datos
observados (consumo urbano en una muestra de vehículos todo terreno) se ajustan a una distribución
normal teórica de media = 12.589 y desviación estándar = 2.8884 (valores obtenidos a partir de la pro-
pia distribución empírica).
El estadístico Z se calcula a partir de la diferencia máxima, en valor absoluto, entre la distribución
de frecuencias acumuladas observadas y teóricas.
3.1 Prueba U de Mann-Whitney (dos muestras con datos independientes)
Antes de comenzar a trabajar con esta prueba, y luego de haber cargado el archivo benefici.sav,
vamos a generar en el mismo la variable PBai_B, la cual corresponde al porcentaje de beneficios sobre
ventas de las 83 empresas de la muestra durante el ejercicio del año B.
Se recuerda que para llevar a cabo esta operación, se debe entrar en Transformar > Calcular varia-
ble; en Variable objetivo se ingresa PBai_B y en Expresión numérica (Bai_B/Ventas_B)*100, luego se
hace clic en Aceptar (Figura 5). En la ventana Vista de datos del archivo benefici.sav nos encontrare-
mos con la variable PBai_B que se acaba de crear.

Figura 5. Generación de la variable PBai_B

Ahora sí, vamos a decir que a través de esta prueba se trata de analizar la posible diferencia en los
porcentajes promedio de beneficios en el ejercicio B entre dos empresas que se encuentran en la varia-
ble Sector. En concreto nos referimos a las del sector 9 (5 empresas químicas) y las del sector 10 (8
empresas del sector público).
La hipótesis nula (H0) que nos proponemos contrastar es que no existe diferencia entre los porcen-
tajes promedios de ambos grupos de empresas.
Los valores medios en el porcentaje de beneficios de las empresas del sector 9 es 8.2238% y del
sector 10 es 29.8911%, con una diferencia del 21.6673%, lo que posiblemente llevará a rechazar la
hipótesis nula de no diferencia significativa entre los porcentajes promedios de ambos grupos de em-
presas. Las desviaciones estándar para ambos grupos son 6.34920 (Sector_9) y 22.38082 (Sector_10),
lo que a simple vista evidencia diferencias relevantes de variancias entre ambas muestras (Figura 6).

Figura 6. Estadísticos descriptivos de los sectores 9 y 10

Este breve análisis tenía por objetivo mostrar la presencia de algunas condiciones (tamaño reducido
de las muestras, variancias desiguales, previsiblemente no ajuste de los datos a una distribución nor-
mal, etc.) que no hacen aconsejable la aplicación de un test paramétrico y sí en cambio la alternativa de
una prueba no paramétrica, como es el caso de la U de Mann-Whitney para dos muestras con datos
independientes, la cual no parte de ningún requisito previo para su aplicación.
Nuevamente posicionados en el archivo benefici.sav, se selecciona la opción Analizar > Pruebas no
paramétricas > Cuadros de diálogo antiguos > 2 muestras independientes…
Luego de secuencia anterior se ingresa PBai_B (variable continua) en Lista Variables de prueba, en
Variable de agrupación se pasa la variable Sector, en Definir grupos…, Grupo 1: 9, Grupo 2: 10, luego
Continuar, el resto de las opciones se deja como está (el test de Mann-Whitney aparece seleccionado por
defecto). Resulta el cuadro de diálogo Pruebas para dos muestras independientes que se observa en la
Figura 7.
Luego se hace clic en Aceptar con lo que se ejecuta el procedimiento y se obtienen los resultados, al-
gunos de los cuales se muestran en la Figura 8.

Figura 7. Cuadro de diálogo Pruebas para dos muestras independientes (Mann-Whitney)

Figura 8. Resultados del test U de Mann-Whitney

Si bien el programa SPSS proporciona algo más de información en cuanto a los resultados que se
muestran en la Figura 8, en esta ocasión no limitaremos a señalar que tanto la distribución muestral de
U como de W siguen una ley normal. El estadístico de contraste Z posee un valor de ‒1.757 y el grado
de significación del mismo (p = 0.0790) lleva a concluir con un riesgo α = 0.10 que se debe rechazar la
hipótesis nula de no existencia de diferencias significativas entre los porcentajes promedios de benefi-
cios del ejercicio año B para los dos grupos de empresas de los sectores 9 y 10, tal como se había con-
siderado inicialmente.

3.2 Test de rachas de Wald-Wolfowitz (dos muestras con datos independientes)


Una alternativa no paramétrica para contrastar si dos muestras con datos independientes proceden
de poblaciones con la misma distribución la constituye el test de rachas de Wald-Wolfowitz (una racha
es una secuencia de observaciones de un mismo atributo o cualidad).
En efecto, en el cuadro de diálogo de la Figura 9 se observan las mismas variables y grupos selec-
cionados en la prueba anterior, solo que ahora la opción elegida es Rachas de Wald-Wolfowitz.
Al ejecutar el procedimiento se obtienen los resultados que se muestran en la Figura 10.
Con un valor de 8 rachas, una estadística Z = 0.828 y un grado de significación p = 0.793, con un
riesgo α = 0.05, no es posible rechazar H0 y, por tanto, se debe concluir que no existe diferencia signi-
ficativa en las distribuciones de los dos grupos de empresas (porcentajes promedios de beneficios del
ejercicio año B en los sectores 9 y 10).
Figura 9. Cuadro de diálogo Pruebas para dos muestras independientes (Wald-Wolfowitz)

Figura 10. Resultados del test de rachas de Wald-Wolfowitz

3.3 Prueba H de Kruskal-Wallis (varias muestras con datos independientes)


Esta prueba es una extensión de la U de Mann-Whitney para el supuesto de tener que analizar tres
o más grupos.
Para trabajar en la prueba H de Kruskal-Wallis utilizaremos de nuevo la variable PBai_B, la cual
fue generada anteriormente y como es conocido corresponde al porcentaje de beneficios sobre ventas
de las 83 empresas de la muestra durante el ejercicio del año B.
La hipótesis nula (H0), como en la prueba U, que nos proponemos contrastar hace referencia a la no
existencia de diferencias significativas en los porcentajes promedios de beneficios, en este ocasión, de
empresas que pertenecen a los sectores 9 (5 empresas químicas), 10 (8 empresas del sector público) y
11 (6 empresas del sector Siderurgia y metalurgias).
Como antes, se debe abrir el archivo benefici.sav y seleccionar la secuencia Analizar > Pruebas no
paramétricas > Cuadros de diálogo antiguos > K muestras independientes…
Luego se incorpora PBai_B (variable continua) en Lista Variables de prueba, en Variable de agrupa-
ción se pasa la variable Sector, en Definir rango…, Grupo 1: 9, Grupo 2: 11, luego Continuar, el resto de
las opciones se deja como está (el test de Kruskal-Wallis aparece en Tipo de prueba seleccionado por
defecto). Resulta el cuadro de diálogo que se observa en la Figura 11.

Figura 11. Cuadro de diálogo Pruebas para varias muestras independientes (Kruskal-Wallis)
Luego se hace clic en Aceptar con lo que se ejecuta el procedimiento y se obtienen los resultados, al-
gunos de los cuales se muestran en la Figura 12.

Figura 12. Resultados del test H de Kruskal-Wallis

En la Figura 12 se observan las medias de rangos de las 19 empresas (3 sectores en este ejemplo).
Cuanto más próximos sean estos promedios más probable es que sea verdad la hipótesis nula (H0) de
no existencia de diferencias significativas entre los grupos o sectores y al revés cuanto más difieran. El
estadístico H de Kruskal-Wallis sigue aproximadamente una distribución χ2 bajo la hipótesis de que
todos los grupos siguen la misma distribución.
En los resultados de la Figura 12 este estadístico vale exactamente 6.812, tiene 2 grados de libertad,
una p = 0.033, de manera que con un riesgo α = 5 % se debe rechazar la H0 de no existencia de diferen-
cias significativas en los porcentajes promedios de beneficios de los tres sectores que se analizaron.

4.1 Test T de Wilcoxon (dos muestras con datos relacionados)


Comenzamos por señalar que, de la misma manera que se ha procedido con la creación de la varia-
ble PBai_B, vamos a generar en el marco del archivo benefici.sav la variable PBai_A, la cual corres-
ponde al porcentaje de beneficios sobre ventas de las 83 empresas de la muestra durante el ejercicio
del año A.
Entonces, se accede a Transformar > Calcular variable; en Variable objetivo se ingresa PBai_A y
en Expresión numérica (Bai_A/Ventas_A)*100, luego se hace clic en Aceptar (Figura 13). En la ven-
tana Vista de datos del archivo benefici.sav se encontrará la variable PBai_A que se acaba de crear.

Figura 13. Generación de la variable PBai_A

En esta ocasión solo se trabajará con las empresas del sector 6 (Eléctricas), así que estando en el
archivo benefici.sav, se entra en Datos > Seleccionar casos… > Si se satisface la condición > Si… >
sector = 6 (se escribe en la ventana que se encuentra en blanco, arriba a la derecha), obteniéndose el
cuadro de diálogo que se muestra en la Figura 14.
Se hace clic en Continuar, y en el cuadro que se abre en Aceptar, se consigue con ello, en la venta-
na Vista de datos, una nueva variable en la que únicamente los casos válidos o seleccionados son los
correspondientes a las 9 empresas del sector 6.

Figura 14. Cuadro de diálogo Seleccionar casos (condición: sector = 6)

A continuación, con el propósito de dar a conocer mayor información acerca de las 9 empresas del
sector eléctrico con las que se trabajará en esta y en la próxima prueba, se brindan datos descriptivos
respecto de los beneficios en los ejercicios A y B (Figura 15).

N° Empresa PBai_A PBai_B PBai_B ‒ PBai_A Signos Rangos


1 Endesa 24.13 24.93 0.79 + 4°
2 Enher 6.39 5.02 ‒1.38 ‒ 7°
3 Fecsa 6.73 7.04 0.31 + 3°
4 Gesa 20.38 20.52 0.15 + 2°
5 Hidrocantábrico 14.80 16.46 1.67 + 8°
6 Iberdrola 11.91 13.13 1.22 + 6°
7 R. Zaragoza 8.23 10.60 2.37 + 9°
8 Sevillana 6.42 6.49 0.07 + 1°
9 Unión-Fenosa 6.75 5.66 ‒1.09 ‒ 5°
Media: PBai_A = 11.7491% PBai_B = 12.2072% PBai_B ‒ PBai_A = 0.4581%
Correlación de Pearson: r = 0.987

Figura 15. Datos de partida de las pruebas de Wilcoxon y Signos

Según se puede ver en la Figura 15, las 9 empresas poseen un porcentaje promedio de beneficios
sobre ventas antes de impuestos los ejercicios A y B del 11.7491% y 12.2072% respectivamente. La
diferencia entre ambos promedios es de 0.4581, lo cual haría pensar en la no existencia de diferencias
significativas entre uno y otro período en cuanto a beneficios. Asimismo se observar una alta correla-
ción de Pearson entre los beneficios de ambos períodos de 0.987.
Los rangos de la última columna de la tabla de la Figura 15 se han obtenido a partir de las diferen-
cias de la columna de esa misma tabla, pero en valores absolutos; es decir, sin tener en cuenta el signo
de la diferencia. Esta es la razón por la que el 1º rango corresponde a Sevillana con una diferencia en-
tre ambos ejercicios A y B de 0.07% y el último rango (9º) a Reunidas de Zaragoza con 2.37%.
Ahora sí se podrá trabajar en la prueba T de Wilcoxon en forma exclusiva con las empresas eléctricas
de la muestra, con el objeto de contrastar la hipótesis nula (H0) de no existencia de diferencias significa-
tivas entre los porcentaje de beneficios sobre ventas antes de impuestos durante ambos ejercicio, A y B.
En efecto, con el archivo abierto benefici.sav se ingresa en Analizar > Pruebas no paramétricas >
Cuadros de diálogo antiguos > 2 muestras relacionadas… A continuación se pasan a la ventana Con-
trastar pares las variables PBai_A y PBai_B como variables 1 y 2 respectivamente, el resto de las op-
ciones se dejan como están (el test de Wilcoxon aparece en Tipo de prueba seleccionado por defecto).
Resulta el cuadro de diálogo Pruebas para dos muestras relacionadas que se observa en la Figura 16.

Figura 16. Cuadro de diálogo Pruebas para dos muestras relacionadas (Wilcoxon)

Al hacer clic en Aceptar se ejecuta el procedimiento y se obtienen los resultados de las 9 empresas,
los dos ejercicios considerados y a nivel de beneficios sobre ventas antes de impuestos en porcentajes
(Figura 17).

Figura 17. Resultados de la prueba T de Wilcoxon

Los resultados de la prueba de Wilcoxon indican la existencia de 2 empresas con rangos de signo
negativo (PBai_B < PBai_A), 7 empresas con rangos de signo positivo y ninguna con igual valor en
uno y otro ejercicio (ningún emparejamiento o par igualado).
Los rangos con signo positivo suman 33, valor que dividido en 7 empresas genera un promedio de
4.71. A su vez, los rangos con signo negativo suman 12, que dividido en 2 empresas, da 6 de promedio.
La distribución Z de esta suma de diferencias tanto positivas como negativas es aproximadamente
normal con media 0 y variancia 1 para tamaños de muestra suficientemente grandes. En esta prueba no
paramétrica con un estadístico Z = −1.244, un grado de significación p = 0.214 y un riesgo α = 5 %,
lleva a no rechazar la H0 de no existencia de diferencias significativas entre ambos ejercicios, A y B,
en cuanto a beneficios.

4.2 Prueba de los signos (dos muestras con datos relacionados)


La prueba de los signos toma en cuenta únicamente el signo de las diferencias entre una y otra va-
riable, una y otra situación, uno y otro ejercicio en el caso de los beneficios de los años A y B.
La hipótesis nula (H0) plantea que el porcentaje (p) de diferencias positivas y negativas ha de ser
igual, en tanto que la alternativa (H1) plantea que este valor ha de ser diferente.
H0: p (+) = p (‒) H1: p (+) ≠ p (‒)
En el presente análisis utilizaremos las mismas variables de la prueba T de Wilcoxon; es decir,
PBai_A, PBai_B (porcentaje de beneficios sobre ventas durante los ejercicios A y B), únicamente para
las 9 empresas eléctricas del sector 6 (ver Figura 18).
Figura 18. Cuadro de diálogo Pruebas para dos muestras relacionadas (Signo)

Como se sabe, del estudio del estudio anterior, estas diferencias fueron exactamente 2 negativas y 7
positivas (en el caso de existir uno o más pares igualados no entran en el recuento).
Por aproximación de una distribución binomial a una normal se obtiene el estadístico Z y el grado
de significación del mismo.

Figura 19. Resultados de la prueba de los signos

Ahora bien, dado que el número total de pares con diferencias positivas o negativas (9) que se está
analizando no supera el valor 25, se calcula el grado de significación de la prueba binomial (no así el
estadístico Z), que es el que nos da la Figura 19 y que vale exactamente p = 0.180.
Esto lleva de nuevo, con un riesgo α = 5 %, a no tener argumentos para rechazar la H0 de no exis-
tencia de diferencias significativas entre los porcentajes de beneficios en los ejercicios A y B de las
empresas del sector eléctrico. Se señala para finalizar que esta prueba es menos potente que la de Wil-
coxon ya que únicamente tiene en cuenta el signo de las diferencias entre pares, en tanto que la de
Wilcoxon incorpora la magnitud de esas diferencias a través de los rangos.

5.1 Prueba χ2 de Friedman (varias muestras con datos relacionados)


Tanto esta prueba como la siguiente corresponden a una generalización de los procedimientos vis-
tos en los tests anteriores (Wilcoxon y Signos), aplicables en aquellas situaciones en las que se debe
trabajar con tres o más variables.
En esta oportunidad se utilizarán las variables continuas Cons90, Cons120 y Consurb, las cuales se
encuentran en el archivo tterreno.sav, ya descripto y empleado en la prueba de Kolmogorov-Smirnov.
Se procede de manera similar a lo realizado en ocasiones anteriores. En efecto, luego de abierto el
programa SPSS y cargado el archivo tterreno.sav, se selecciona la opción Analizar > Pruebas no paramé-
tricas > Cuadros de diálogo antiguos > K muestras relacionadas… Posteriormente de esta secuencia se
ingresan Cons90, Cons120 y Consurb en Variables de prueba y se deja el resto de opciones por defecto
(en Tipo de prueba se halla seleccionado Friedman). Resulta el cuadro de diálogo Pruebas para varias
muestras relacionadas que se observa en la Figura 20.
Figura 20. Cuadro de diálogo Pruebas para varias muestras relacionadas (Friedman)

Si se hace clic en Aceptar se ejecutará el procedimiento y se obtendrán los resultados que pueden
verse en la Figura 21, los cuales se comentaran más adelante.

Figura 21. Resultados del test de Friedman

Antes de interpretar los resultados del test de Friedman, haremos referencia a la información que se
proporciona en la Figura 22. En ella, se aprecian ciertos valores para los 10 primeros vehículos del
archivo tterreno.sav. Se puede ver en las tres últimas columnas para cada caso y variable del test el rango
asignado (se anulan aquellos casos con valores perdidos en alguna de las variables). En la última fila se
encuentran la suma de estos rangos y el promedio correspondiente para el ejemplo propuesto.

Rango Rango Rango


N° Marca Modelo Cons90 Cons120 Consurb
Cons90 Cons90 Consurb
1 Asia Motors Roesta 1.8 9.0 ‒‒ 12.0 ‒‒ ‒‒ ‒‒
2 Asia Motors Roesta 2.2 8.0 ‒‒ 12.0 ‒‒ ‒‒ ‒‒
3 Asia Motors Roesta 2.2 8.0 ‒‒ 12.0 ‒‒ ‒‒ ‒‒
4 Chevrolet Blazer 9.6 12.6 15.6 1° 2° 3°
5 Daihatsu Feroza 7.6 11.9 10.5 1° 3° 2°
6 Ford Maverick 2.4 8.7 12.3 13.3 1° 2° 3°
7 Ford Maverick 2.7 7.5 11.8 10.3 1° 3° 2°
8 Ford Maverick 2.7 7.5 11.8 10.3 1° 3° 2°
9 Ford Maverick 2.7 8.6 13.1 11.8 1° 3° 2°
10 Ford Maverick 2.7 8.6 13.1 11.8 1° 3° 2°
Totales de rangos: 7 19 16
Medias de rangos: 1 2.71 2.28
Figura 22. Tabla de rango para el test de Friedman

Ahora sí se puede indicar que las medias de rangos para los 109 casos válidos del archivo tterre-
no.sav para la prueba de Friedman son las que aparecen en la Figura 21. Cuanto más semejantes sean,
más probable es que sea verdad la H0 de no existencia de diferencia significativa en el consumo pro-
medio de los vehículos de la muestra a 90 km/hora, a 120 km/hora y en ciudad; por el contrario, cuanto
más difieran, como es razonable que suceda en este caso, más probable es que se deba rechazar la H0.
Estas medias de rangos siguen aproximadamente una distribución χ2 que en este análisis tiene un
valor de 150.222 y que con un grado de significación p = 0.000 indica que, con un riesgo α = 5 %, se
debe rechazar la hipótesis nula de la no existencia de diferencias significativas en los consumos a 90
km/hora, 120 km/hora y en ciudad.

5.2. Test W de Kendall (varias muestras con datos relacionados)


El presente test analiza la concordancia o la coherencia entre los resultados obtenidos por los dife-
rentes casos de una muestra en las distintas variables. En efecto, así como a través de la distribución χ2
de Friedman fue posible determinar en qué medida la muestra de todoterrenos consume más o menos a
90 km/hora, 120 km/hora o en ciudad, el estadístico W de Kendall dará una idea de si existe concor-
dancia o coherencia en los consumos de los vehículos, en el sentido de si los que menos consumen a
90 km/hora son también los que menos consumen a 120 km/hora y en ciudad, y viceversa. En conse-
cuencia, se está más bien delante de una prueba de relación que de comparación.
El proceso de cálculo del estadístico W es muy parecido al utilizado para la prueba χ2 de Friedman,
sus valores oscilan entre 0 y 1, correspondiendo el valor 1 a una coherencia, concordancia o correla-
ción perfecta y el valor 0 justamente a todo lo contrario.
De manera similar a lo realizado en la prueba anterior, luego de abierto el programa SPSS y cargado
el archivo tterreno.sav, se selecciona la opción Analizar > Pruebas no paramétricas > Cuadros de diálogo
antiguos > K muestras relacionadas… Posteriormente se ingresan Cons90, Cons120 y Consurb en Va-
riables de prueba y en Tipo de prueba se elige W de Kendall (se debe desmarcar la prueba Friedman, ya
que ésta se encuentra señalada por defecto). Resulta el cuadro de diálogo que se observa en la Figura 23.

Figura 23. Cuadro de diálogo Pruebas para varias muestras relacionadas (Kendall)

El valor W = 0.689 obtenido en la Figura 24 para los datos de este estudio indica una concordancia
razonablemente alta (los vehículos que menos consumen a 90 son también los que menos consumen a
120 y en ciudad, y los que más consumen a 90 son también los que más consumen a 120 y en ciudad),
en coincidencia con los resultados que se proporcionan para χ2 = 150.222 y una p = 0.000.

Figura 24. Resultados del test de Kendall

También podría gustarte