Documentos de Académico
Documentos de Profesional
Documentos de Cultura
B. Tests-No-Paramétricos
B. Tests-No-Paramétricos
Se ingresa Sector (variable nominal) en Lista Variables de prueba y se deja el resto de opciones por
defecto. Se ejecuta el procedimiento, obteniéndose la salida de la Figura 2. La intención en este ejem-
plo es averiguar si las frecuencias de las categorías de la variable Sector se ajustan a una distribución
uniforme.
Se puede observar en estos resultados que en el archivo benefici.sav las 83 empresas de la muestra
están distribuidas por sectores de acuerdo con las frecuencias observadas que aparecen en la columna
correspondiente (N observado); es decir, 7 de alimentación, 2 de automoción, 8 de cementos y construc-
toras, etc. A continuación aparece la columna con las frecuencias esperadas (N esperada), que en este
caso y puesto que la opción seleccionada en el cuadro de diálogo de la Figura 1 para Valores esperados
ha sido Todas las categorías iguales, es un simple cociente entre el total de la muestra (N = 83) y el
número de categorías de la variable (K = 12). Equivale a efectuar el ajuste a una distribución uniforme.
Los residuos son las diferencias entre unas y otras, frecuencias observadas y frecuencias esperadas.
Variable Descripción
Marca Marca del vehículo
Modelo Modelo del vehículo
Pvp Precio venta público
Cilindro Número de cilindros
Cc Cilindrada en cm3
Potencia Potencia en CV
Rpm Revoluciones por minuto
Peso Peso en kg
Plazas Número de plazas
Cons90 Consumo en litros a 90 km/hora
Cons120 Consumo en litros a 120 km/hora
Consurb Consumo en litros en recorrido urbano
Velocidad Velocidad máxima
Acelerac Aceleración en segundos de 0 a 100 km/hora
Luego de abierto el programa SPSS y cargado el archivo tterreno.sav, se selecciona la opción Anali-
zar > Pruebas no paramétricas > Cuadros de diálogo antiguos > K-S de 1 muestra… Posteriormente de
esta secuencia se ingresa Consurb (variable continua) en Lista Variables de prueba y se deja el resto de
opciones por defecto. Resulta el cuadro de diálogo Prueba de Kolmogorov-Smirnov para una muestra
que se observa en la Figura 3.
De acuerdo con la salida proporcionada por SPSS 26, de los 125 vehículos que forman la muestra,
solo 118 poseen puntuaciones en la variable Consurb, de los 7 restantes no se dispone de esta informa-
ción.
En virtud de que el estadístico de prueba Z = 0.134 tiene asociado un grado de significación igual a
0.000 (valor p), con un riesgo de α = 0.05 debemos rechazar la hipótesis nula (H0) de que los datos
observados (consumo urbano en una muestra de vehículos todo terreno) se ajustan a una distribución
normal teórica de media = 12.589 y desviación estándar = 2.8884 (valores obtenidos a partir de la pro-
pia distribución empírica).
El estadístico Z se calcula a partir de la diferencia máxima, en valor absoluto, entre la distribución
de frecuencias acumuladas observadas y teóricas.
3.1 Prueba U de Mann-Whitney (dos muestras con datos independientes)
Antes de comenzar a trabajar con esta prueba, y luego de haber cargado el archivo benefici.sav,
vamos a generar en el mismo la variable PBai_B, la cual corresponde al porcentaje de beneficios sobre
ventas de las 83 empresas de la muestra durante el ejercicio del año B.
Se recuerda que para llevar a cabo esta operación, se debe entrar en Transformar > Calcular varia-
ble; en Variable objetivo se ingresa PBai_B y en Expresión numérica (Bai_B/Ventas_B)*100, luego se
hace clic en Aceptar (Figura 5). En la ventana Vista de datos del archivo benefici.sav nos encontrare-
mos con la variable PBai_B que se acaba de crear.
Ahora sí, vamos a decir que a través de esta prueba se trata de analizar la posible diferencia en los
porcentajes promedio de beneficios en el ejercicio B entre dos empresas que se encuentran en la varia-
ble Sector. En concreto nos referimos a las del sector 9 (5 empresas químicas) y las del sector 10 (8
empresas del sector público).
La hipótesis nula (H0) que nos proponemos contrastar es que no existe diferencia entre los porcen-
tajes promedios de ambos grupos de empresas.
Los valores medios en el porcentaje de beneficios de las empresas del sector 9 es 8.2238% y del
sector 10 es 29.8911%, con una diferencia del 21.6673%, lo que posiblemente llevará a rechazar la
hipótesis nula de no diferencia significativa entre los porcentajes promedios de ambos grupos de em-
presas. Las desviaciones estándar para ambos grupos son 6.34920 (Sector_9) y 22.38082 (Sector_10),
lo que a simple vista evidencia diferencias relevantes de variancias entre ambas muestras (Figura 6).
Este breve análisis tenía por objetivo mostrar la presencia de algunas condiciones (tamaño reducido
de las muestras, variancias desiguales, previsiblemente no ajuste de los datos a una distribución nor-
mal, etc.) que no hacen aconsejable la aplicación de un test paramétrico y sí en cambio la alternativa de
una prueba no paramétrica, como es el caso de la U de Mann-Whitney para dos muestras con datos
independientes, la cual no parte de ningún requisito previo para su aplicación.
Nuevamente posicionados en el archivo benefici.sav, se selecciona la opción Analizar > Pruebas no
paramétricas > Cuadros de diálogo antiguos > 2 muestras independientes…
Luego de secuencia anterior se ingresa PBai_B (variable continua) en Lista Variables de prueba, en
Variable de agrupación se pasa la variable Sector, en Definir grupos…, Grupo 1: 9, Grupo 2: 10, luego
Continuar, el resto de las opciones se deja como está (el test de Mann-Whitney aparece seleccionado por
defecto). Resulta el cuadro de diálogo Pruebas para dos muestras independientes que se observa en la
Figura 7.
Luego se hace clic en Aceptar con lo que se ejecuta el procedimiento y se obtienen los resultados, al-
gunos de los cuales se muestran en la Figura 8.
Si bien el programa SPSS proporciona algo más de información en cuanto a los resultados que se
muestran en la Figura 8, en esta ocasión no limitaremos a señalar que tanto la distribución muestral de
U como de W siguen una ley normal. El estadístico de contraste Z posee un valor de ‒1.757 y el grado
de significación del mismo (p = 0.0790) lleva a concluir con un riesgo α = 0.10 que se debe rechazar la
hipótesis nula de no existencia de diferencias significativas entre los porcentajes promedios de benefi-
cios del ejercicio año B para los dos grupos de empresas de los sectores 9 y 10, tal como se había con-
siderado inicialmente.
Figura 11. Cuadro de diálogo Pruebas para varias muestras independientes (Kruskal-Wallis)
Luego se hace clic en Aceptar con lo que se ejecuta el procedimiento y se obtienen los resultados, al-
gunos de los cuales se muestran en la Figura 12.
En la Figura 12 se observan las medias de rangos de las 19 empresas (3 sectores en este ejemplo).
Cuanto más próximos sean estos promedios más probable es que sea verdad la hipótesis nula (H0) de
no existencia de diferencias significativas entre los grupos o sectores y al revés cuanto más difieran. El
estadístico H de Kruskal-Wallis sigue aproximadamente una distribución χ2 bajo la hipótesis de que
todos los grupos siguen la misma distribución.
En los resultados de la Figura 12 este estadístico vale exactamente 6.812, tiene 2 grados de libertad,
una p = 0.033, de manera que con un riesgo α = 5 % se debe rechazar la H0 de no existencia de diferen-
cias significativas en los porcentajes promedios de beneficios de los tres sectores que se analizaron.
En esta ocasión solo se trabajará con las empresas del sector 6 (Eléctricas), así que estando en el
archivo benefici.sav, se entra en Datos > Seleccionar casos… > Si se satisface la condición > Si… >
sector = 6 (se escribe en la ventana que se encuentra en blanco, arriba a la derecha), obteniéndose el
cuadro de diálogo que se muestra en la Figura 14.
Se hace clic en Continuar, y en el cuadro que se abre en Aceptar, se consigue con ello, en la venta-
na Vista de datos, una nueva variable en la que únicamente los casos válidos o seleccionados son los
correspondientes a las 9 empresas del sector 6.
A continuación, con el propósito de dar a conocer mayor información acerca de las 9 empresas del
sector eléctrico con las que se trabajará en esta y en la próxima prueba, se brindan datos descriptivos
respecto de los beneficios en los ejercicios A y B (Figura 15).
Según se puede ver en la Figura 15, las 9 empresas poseen un porcentaje promedio de beneficios
sobre ventas antes de impuestos los ejercicios A y B del 11.7491% y 12.2072% respectivamente. La
diferencia entre ambos promedios es de 0.4581, lo cual haría pensar en la no existencia de diferencias
significativas entre uno y otro período en cuanto a beneficios. Asimismo se observar una alta correla-
ción de Pearson entre los beneficios de ambos períodos de 0.987.
Los rangos de la última columna de la tabla de la Figura 15 se han obtenido a partir de las diferen-
cias de la columna de esa misma tabla, pero en valores absolutos; es decir, sin tener en cuenta el signo
de la diferencia. Esta es la razón por la que el 1º rango corresponde a Sevillana con una diferencia en-
tre ambos ejercicios A y B de 0.07% y el último rango (9º) a Reunidas de Zaragoza con 2.37%.
Ahora sí se podrá trabajar en la prueba T de Wilcoxon en forma exclusiva con las empresas eléctricas
de la muestra, con el objeto de contrastar la hipótesis nula (H0) de no existencia de diferencias significa-
tivas entre los porcentaje de beneficios sobre ventas antes de impuestos durante ambos ejercicio, A y B.
En efecto, con el archivo abierto benefici.sav se ingresa en Analizar > Pruebas no paramétricas >
Cuadros de diálogo antiguos > 2 muestras relacionadas… A continuación se pasan a la ventana Con-
trastar pares las variables PBai_A y PBai_B como variables 1 y 2 respectivamente, el resto de las op-
ciones se dejan como están (el test de Wilcoxon aparece en Tipo de prueba seleccionado por defecto).
Resulta el cuadro de diálogo Pruebas para dos muestras relacionadas que se observa en la Figura 16.
Figura 16. Cuadro de diálogo Pruebas para dos muestras relacionadas (Wilcoxon)
Al hacer clic en Aceptar se ejecuta el procedimiento y se obtienen los resultados de las 9 empresas,
los dos ejercicios considerados y a nivel de beneficios sobre ventas antes de impuestos en porcentajes
(Figura 17).
Los resultados de la prueba de Wilcoxon indican la existencia de 2 empresas con rangos de signo
negativo (PBai_B < PBai_A), 7 empresas con rangos de signo positivo y ninguna con igual valor en
uno y otro ejercicio (ningún emparejamiento o par igualado).
Los rangos con signo positivo suman 33, valor que dividido en 7 empresas genera un promedio de
4.71. A su vez, los rangos con signo negativo suman 12, que dividido en 2 empresas, da 6 de promedio.
La distribución Z de esta suma de diferencias tanto positivas como negativas es aproximadamente
normal con media 0 y variancia 1 para tamaños de muestra suficientemente grandes. En esta prueba no
paramétrica con un estadístico Z = −1.244, un grado de significación p = 0.214 y un riesgo α = 5 %,
lleva a no rechazar la H0 de no existencia de diferencias significativas entre ambos ejercicios, A y B,
en cuanto a beneficios.
Como se sabe, del estudio del estudio anterior, estas diferencias fueron exactamente 2 negativas y 7
positivas (en el caso de existir uno o más pares igualados no entran en el recuento).
Por aproximación de una distribución binomial a una normal se obtiene el estadístico Z y el grado
de significación del mismo.
Ahora bien, dado que el número total de pares con diferencias positivas o negativas (9) que se está
analizando no supera el valor 25, se calcula el grado de significación de la prueba binomial (no así el
estadístico Z), que es el que nos da la Figura 19 y que vale exactamente p = 0.180.
Esto lleva de nuevo, con un riesgo α = 5 %, a no tener argumentos para rechazar la H0 de no exis-
tencia de diferencias significativas entre los porcentajes de beneficios en los ejercicios A y B de las
empresas del sector eléctrico. Se señala para finalizar que esta prueba es menos potente que la de Wil-
coxon ya que únicamente tiene en cuenta el signo de las diferencias entre pares, en tanto que la de
Wilcoxon incorpora la magnitud de esas diferencias a través de los rangos.
Si se hace clic en Aceptar se ejecutará el procedimiento y se obtendrán los resultados que pueden
verse en la Figura 21, los cuales se comentaran más adelante.
Antes de interpretar los resultados del test de Friedman, haremos referencia a la información que se
proporciona en la Figura 22. En ella, se aprecian ciertos valores para los 10 primeros vehículos del
archivo tterreno.sav. Se puede ver en las tres últimas columnas para cada caso y variable del test el rango
asignado (se anulan aquellos casos con valores perdidos en alguna de las variables). En la última fila se
encuentran la suma de estos rangos y el promedio correspondiente para el ejemplo propuesto.
Ahora sí se puede indicar que las medias de rangos para los 109 casos válidos del archivo tterre-
no.sav para la prueba de Friedman son las que aparecen en la Figura 21. Cuanto más semejantes sean,
más probable es que sea verdad la H0 de no existencia de diferencia significativa en el consumo pro-
medio de los vehículos de la muestra a 90 km/hora, a 120 km/hora y en ciudad; por el contrario, cuanto
más difieran, como es razonable que suceda en este caso, más probable es que se deba rechazar la H0.
Estas medias de rangos siguen aproximadamente una distribución χ2 que en este análisis tiene un
valor de 150.222 y que con un grado de significación p = 0.000 indica que, con un riesgo α = 5 %, se
debe rechazar la hipótesis nula de la no existencia de diferencias significativas en los consumos a 90
km/hora, 120 km/hora y en ciudad.
Figura 23. Cuadro de diálogo Pruebas para varias muestras relacionadas (Kendall)
El valor W = 0.689 obtenido en la Figura 24 para los datos de este estudio indica una concordancia
razonablemente alta (los vehículos que menos consumen a 90 son también los que menos consumen a
120 y en ciudad, y los que más consumen a 90 son también los que más consumen a 120 y en ciudad),
en coincidencia con los resultados que se proporcionan para χ2 = 150.222 y una p = 0.000.