No Parametrica

CAPÍTULO
12
TIPO DE
M. INDEPENDIENTES M. PAREADAS
VARIABLES
CUALITATIVA Prueba z de comparación de Test de Mc Nemar

proporciones
CUALITATIVA x2 de Pearson
CUALITATIVA t Student-Fisher t de Student-Fisher

(k = 2) Análisis de la varianza Wilcoxon
U de Mann-Whitney
CUALITATIVA
INTRODUCCIÓN CUALITATIVA
(k = 2)
Análisis de la varianza
Kruskal-Wallis*
Análisis de la varianza
Friedman*
A LA ESTADÍSTICA CUALITATIVA
NO PARAMÉTRICA Figura 12.1 Estadística no paramétrica Fuente:

http://www.jmcprl.net/ntps/@datos/
ntp_380_archivos/n380_06.jpg
12.1 Estadística no paramétrica. Objetivo:

12.1.1 Características de las pruebas no paramétricas.
12.2 Ventajas y desventajas del uso de métodos no El lector reconocerá las ventajas y desventajas del uso de métodos
paramétricos. no paramétricos; además, identificará cuál prueba de varias de tipo
12.3 Prueba del signo. no paramétrico como son la de Wilcoxon, U de Mann Withney y
12.4 Prueba del rango con signo de Wilcoxon. Kolmogorov–Smirnov, es la más conveniente y pertinente para
12.5 Pruebas de suma de rangos. aplicar en problemáticas con variables de tipo cualitativo en el área
12.5.1 Prueba de Wilcoxon. de ciencias sociales y administrativas.
12.5.2 Prueba U de Mann Whitney.
12.6 Prueba de Kolmogorov–Smirnov.
Iniciaremos el contenido de este capítulo bajo una estrategia de

aprendizaje denominada mapa conceptual, para tener una visión
global de lo que se presentará.
518 12 Introducción a la estadística no paramétrica
Introducción:
Algunas problemáticas generan respuestas que no son cuantificables, porque son cualitativas,
es decir, producen mediciones que logran ordenarse, aunque la posición de la respuesta en una
escala de medición es arbitraria. Este tipo de fenómenos ocurren en casi todos los campos de
estudio, pero son particularmente frecuentes en las ciencias sociales y administrativas.
Los métodos estadísticos no paramétricos son útiles no únicamente cuando los datos representan
una ordenación como la mencionada, también lo son cuando se tienen diferencias direccionales.
El cúmulo de conocimientos a considerar y aprender no es todo lo que hay por estudiar ni es
poco para plantear desde su aplicación. Tales conocimientos se basan en pruebas no
paramétricas diversas que desde una postura personal, como autora, considero deben ser
tratadas, pues son un complemento a las vistas en capítulos anteriores para el caso paramétrico.
Con la finalidad de llevar a cabo la aplicación o el uso de dichas pruebas no paramétricas no
se necesita hacer suposiciones acerca de la distribución de la población. En ocasiones, por
esto último, se utiliza el nombre de que son libres de distribución. Además, remarcamos que
no requieren que las respuestas estén clasificadas, razón por la que llegan a ser medidas con
una escala ordinal, de razón o de intervalo.
Estadística no
Paramétrica
Consta de Consta de
Tiene
Introducción Pruebas
Ventajas y
y desventajas en su uso como
de Kolmogorov -
Características del signo
Smirnov
de suma de rangos
como
del rango con signo
y Wilcoxon U de Mann Whitney
Wilcoxon
Figura 12.2 Mapa conceptual de estadística no paramétrica
Alfaomega Estadística en el área de las Ciencias Sociales y Administrativas – Aragón

12.1 Estadística no paramétrica 519
En este capítulo se consideran cinco pruebas no paramétricas; a saber, la del signo, la del
rango con signo de Wilcoxon, la de suma de rangos de Wilcoxon, la de U de Mann Withney y
la de Kolmogorov–Smirnov.
12.1 Estadística no paramétrica
Hay muchas situaciones en las cuales no es posible aplicar los métodos paramétricos, ya que estos se relacionan
con parámetros tales como la media, la proporción, la varianza, diferencia de medias y de proporciones, por
mencionar algunos. Varias de dichas situaciones, que se presentarán como ejemplos, son las siguientes:
Ejemplo 12.1
Si se pide a un comité que evalué la capacidad de diez candidatos para un puesto y a los jueces que ordenen
por rango los méritos relativos de cinco finalistas en un concurso de belleza, ¿qué se plantearía al respecto?
Solución
Las medidas a aplicar para dar respuesta a lo solicitado serán de una naturaleza completamente diferente a
las trabajadas, ya que siempre que se realicen observaciones o mediciones en términos de rangos u órdenes
resultan adecuados los métodos no paramétricos (a menudo se denominan como técnicas de orden), pues éstos
no se refieren a parámetros.
Nota: Recordemos que en la estadística paramétrica los parámetros son características de la población,
mientras que los estadísticos lo son de la muestra. Luego, en consecuencia, se entendería que redactar un
parámetro poblacional estadísticamente parecería un pleonasmo.
Ejemplo 12.2
Suponga que se desean evaluar y comparar las habilidades de cuatro vendedores. ¿Qué plantearía al respecto?
Solución
Es claro que dar una medida exacta de la habilidad en ventas, es imposible.
Ejemplo 12.3
Suponga que se desea medir las características de sabor de cinco marcas de cereales. ¿Qué plantearía al respecto?
Solución
Dar una medida cuantitativa del sabor en comida alguna sería muy difícil, aunque en determinadas situaciones
hay quien lo pretenda hacer sin tomar en consideración que lo que se está trabajando estadísticamente conlleva
error y a veces ese error es grave.
Estadística en el área de las Ciencias Sociales y Administrativas – Aragón Alfaomega

Ejemplo 12.4
Una persona suele indicar su preferencia entre un par de artículos de prueba. ¿Qué plantearía al respecto?
Solución
Preferencia no quiere decir no querer o no poder indicar una medida de la magnitud de su preferencia.
A algunas técnicas no paramétricas se les llama a menudo “pruebas de rango”, “pruebas de orden”, cuyos
títulos nos indican otras diferencias con las pruebas paramétricas. Al computar pruebas paramétricas, sumamos,
dividimos y multiplicamos los puntajes de las muestras. Cuando tales operaciones aritméticas se hacen con
puntajes que no son verdaderamente numéricos, ocasionan deformaciones de los datos y menoscaban el valor
de las conclusiones de la prueba. En cambio, muchas pruebas no paramétricas se fijan en el orden o rango de
los puntajes, no en sus “valores numéricos”, mientras otras técnicas no paramétricas se utilizan con datos en
los que ni siquiera es posible imprimir una orden, por ejemplo, con datos clasificatorios.
No todas las poblaciones tienen siempre el comportamiento de una distribución normal, como la ya trabajada
prueba de bondad de ajuste, donde se indicó que la población aproximadamente tenía un comportamiento
como la distribución normal, donde no siempre estamos seguros de que tener la razón, ya que la prueba no es
confiable en un 100%. También se dan situaciones donde el empleo de la distribución normal no es el adecuado,
en cuyos casos necesitamos alternativas frente a la estadística paramétrica; más aún, en las pruebas de hipótesis
específicas que se han utilizado hasta aquí.
Hay quienes diferencian lo paramétrico de lo no paramétrico por el uso del tipo de variable, es decir,
que las variables de tipo cuantitativo van de la mano con lo paramétrico y las variables cualitativas
van con lo no paramétrico.
Los estadísticos han desarrollado técnicas útiles que no hacen suposiciones restrictivas sobre la
forma o el comportamiento de las distribuciones de las poblaciones. A dichas técnicas se les conoce
con el nombre de pruebas no paramétricas.
12.2.1 Características de las pruebas no paramétricas

Es conveniente plantear las características de las pruebas no paramétricas bajo el establecimiento inicial de las
paramétricas, para hacer la diferencia y remarcar la importancia de las características de las no paramétricas.
Características de las pruebas paramétricas
Algunas características de los procedimientos para pruebas paramétricas son las que se enuncian en seguida:
• I mplican forzosamente la prueba de los parámetros hipotéticos. Como se ha planteado en capítulos

anteriores, para situaciones que contienen una sola muestra pequeña la prueba t de Student se
relaciona con un valor específico para la media de la población, mientras que para situaciones que
contienen dos o más muestras las pruebas t y F se ocupan de probar diferencias entre medias
verdaderas o reales. Este nombre lo reciben para referirse a que son de la población y no de la
muestra

12.1 Estadística no paramétrica 521
• n los procedimientos del caso se alcanza un nivel “complejo” de medición de los datos recopilados,
E
lo cuales se conocen como escala de intervalo o escala de proporción, es decir, en ellos el nivel
de medición obtenido debe ser de “suficiente fuerza” de modo que las operaciones aritméticas
de suma, resta, multiplicación y división de los datos obtenidos sean significativas. Por supuesto
lo anterior implica que los datos habrán de ser continuos y cuantitativos, no cualitativos. En
consecuencia, los datos no se logran con sólo clasificar las observaciones en diversas categorías
distintas, como “sí”, “no” “no está seguro”, ni tampoco con sólo darles orden o rangos a las
observaciones con base en esquemas como “del más bajo al más alto”.
• ienen la necesidad de hacer supuestos muy estrictos, sólo son válidos si estas suposiciones se
T
cumplen. Algunas de tales suposiciones son las siguientes:
• ue los datos de una muestra se extraigan en forma aleatoria de una población con distribu-
Q
ción normal y que las observaciones sean independientes entre sí.
• ara situaciones relacionadas con medidas de tendencia central, para las cuales se han to-
P
mado dos o más muestras, que éstas sean elegidas de poblaciones con comportamiento de
una distribución normal y que sus varianzas sean iguales.
Características de las pruebas no paramétricas
Algunas características de los procedimientos para pruebas no paramétricas se consideran, en términos gene-
rales, como lo enunciado en seguida:
• No se relacionan con los parámetros de una población.

• ue la prueba estadística no depende de la forma del comportamiento de la distribución subya-
Q
cente a la población de la cual se tomaron los datos de la muestra.
• Que se cuente con datos fuertes para aplicar operaciones aritméticas significativas.
Algunas pruebas trabajadas en estadística paramétrica, como las pruebas para una, dos y “c” muestras para las
proporciones, así como las pruebas de Ji-cuadrada de independencia y la de bondad de ajuste parecen seguir
las características para pruebas no paramétricas en forma amplia.
Las técnicas no paramétricas son útiles porque no hacen suposiciones restrictivas sobre la forma de las distri-
buciones poblacionales.
Los métodos no paramétricos son libres de distribución, es decir, no requieren de consideración

acerca del patrón de la distribución de la población que es la base. Sin embargo, los términos “no
paramétrico” y libre de distribución” no son sinónimos, ya que “no paramétrico” se emplea para
describir una prueba que no implica parámetros específicos, mientras que “libre de distribución” se
refiere a una prueba que no requiere consideración acerca de la forma de la distribución o el compor-
tamiento de la población. A pesar de esta diferencia, el término “métodos no paramétricos” se utiliza
comúnmente para referirse a pruebas que impliquen cualquiera o ambos de los casos ya referidos.
Los métodos no paramétricos requieren menos consideraciones y son más fáciles de explicar, entender y utili-
zar, ya que son especialmente aplicables cuando las observaciones son susceptibles de ordenarse, pero no de
medirse con el empleo de una escala cuantitativa.

12.2
Ventajas y desventajas del uso de métodos
no paramétricos
Ventajas
Hay numerosas ventajas del uso de pruebas no paramétricas, algunas de las cuales se enlistan en seguida.
a) Suelen ser más económicos que los procedimientos clásicos, porque el que está llevando a cabo su aplicación
logra aumentar la potencia de respuesta al ahorrar tiempo, dinero y trabajo, cuando selecciona muestras más
grandes de datos que se miden con más exactitud, es decir, datos cualitativos o datos en forma de rango para
obtener una solución más rápida de los problemas.
b) Suelen ser fáciles de aplicar y rápidos para operar cuando los tamaños de las muestras son pequeñas, lo cual
casi siempre ocurre. A menudo, se usan, para pruebas piloto, estudios preliminares en situaciones donde
hay necesidad de respuestas casi inmediatas.
c) Permiten la solución de problemas que no implican la prueba de los parámetros.
d) Es posible utilizarlas con tipos de datos cualitativos como son: de escala nominal, de escala ordinal y de
escala de intervalo o de proporción.
Los de escala nominal son aquellos que, como su nombre lo indica, son nombres o categorías, los posibles
valores de la variable.
Los datos de escala ordinal son los que se localizan o abarcan una forma de orden creciente o decreciente,
o un rango.
Los datos de escala de intervalo o proporción son esos que se han medido con más precisión.
e) Tienen menos suposiciones y no son tan estrictas, ya que se satisfacen con más facilidad que los procedimientos
paramétricos o clásicos.
f) Gozan de mayor aplicabilidad, puesto que dan por resultado un grupo de conclusiones más generales bajo
una base más amplia.
g) Llegan a ser casi tan potentes, según el procedimiento particular seleccionado, como los procedimientos
paramétricos, cuando se satisfacen las suposiciones de estos últimos y ser más eficientes, cuando no se
cumplen los supuestos del procedimiento clásico o paramétrico.
Se debe remarcar que los métodos o procedimientos no paramétricos se llegan a emplear con ventaja en variedad
de situaciones.
Desventajas
Algunas desventajas del uso de pruebas no paramétricas se enlistan en seguida:

a) Conforme aumenta el tamaño de la muestra, la operatividad de datos requerida para los procedimientos no
paramétricos suelen ser laboriosas, salvo que estén disponibles programas en paquetes computacionales,
para la solución de dichos problemas específicos.
b) Resulta desventajoso utilizar los procedimientos no paramétricos cuando se satisfacen todas las suposiciones
de los procedimientos paramétricos y los datos se miden en una escala de intervalo o de proporción, salvo
que se usen métodos paramétricos en tales casos. El que maneja métodos no paramétricos no aprovecha al
máximo los datos, ya que se pierde la información cuando se convierten los datos recopilados de una escala
de intervalo o de proporción a una escala ordinal o a una escala nominal.
En particular, en esas circunstancias, hay algunas pruebas no paramétricas muy rápidas y sencillas, que
tienen mucha menos potencia que los métodos paramétricos y, por lo tanto, se deben evitar en lo posible.

12.3 Prueba del signo 523
c) Hay varios tipos de problemas estadísticos para los cuales todavía no se han desarrollado procedimientos
no paramétricos.
En conclusión, la principal ventaja de las pruebas no paramétricas consiste en que llegan a realizarse
inferencias exactas cuando las suposiciones fundamentales de los métodos estándar no se cumplen
en su totalidad; su principal desventaja radica en que exigen menos cuando todas las suposiciones
se satisfacen.
Algunos tipos de pruebas no paramétricas se enuncian en seguida:
1. La prueba del signo.

Se aplica a datos pareados en una muestra y se basa en signos positivos y negativos, los cuales sustituyen
a los valores cuantitativos.
2. La prueba del rango con signo.

También llamada prueba de Wilcoxon. Es más completa que la prueba del signo, ya que no ignora la magnitud
de la diferencia entre pares de valores de una muestra.
3. La pruebas de suma de rangos. La prueba de Wilcoxon se utiliza cuando no se satisfacen las suposiciones
de una prueba paramétrica para dos muestras como sería una prueba con la distribución t de Student.
a) La prueba de Kruskal–Wallis, que generaliza el análisis de variancia para permitirnos prescindir del
supuesto de que las poblaciones están distribuidas normalmente.
b) La prueba U de Mann Withney, que llega a emplearse para determinar si dos muestras independientes
han sido tomadas de la misma población, la cual usa más información que la prueba del signo.
4. La prueba de Kolmogorov–Smirnov. No requiere que los datos sean agrupados en alguna forma, y sirve
para determinar si hay una diferencia significativa entre la distribución de frecuencias observadas y una
distribución teóricas de frecuencias.
12.3 Prueba del signo
La prueba debe su nombre al uso de los signos  y  para establecer una diferencia en función de dirección, no
en magnitud de un par de observaciones, en la medición en lugar de cantidades, como es en el caso paramétrico.
Es particularmente útil cuando la medición cuantitativa es imposible o no es práctica, aunque se cuenta con
un cierto orden entre los miembros de cada pareja en una muestra. Tal prueba es aplicable en el caso de se
cuente con dos muestras relacionadas y cuando él que la utiliza desea establecer que ambas condiciones son
diferentes. El único supuesto asociado a la prueba es la continuidad de la variable considerada, es decir, no se
hace ningún supuesto acerca de la forma de la distribución de las diferencias ni se pide que todos los datos se
tomen de la misma población.
Una aplicación común de esta prueba se presenta en la investigación de mercados, donde consiste en emplear
una muestra de “n” clientes potenciales para determinar la preferencia hacia una de dos marcas de un cierto
producto; por ejemplo, leche, cafés, refrescos, etcétera. Como es posible identificar, las preferencias son una
variable nominal, pero lo que interesa es encontrar si hay una diferencia entre las preferencias hacia los dos
artículos que se comparan.

La prueba del signo se llega a presentar en tres tipos de problemáticas y bajo dos tamaños de pares
comparados, es decir, para una muestra de diferencias pequeña y para una muestra de diferencias
grande.
Para el caso de una muestra de diferencias pequeña n  20, se establece la prueba de dos extremos o de un
extremo en dos casos, que son los siguientes:
a) Por información previa o por la naturaleza de la información se cuenta con un valor promedio (mediana) de
referencia, denotado por µ0 y un solo conjunto de datos u observaciones que, al ser comparados con ese valor
fijo, nos darán los signos de más y de menos, según sean mayores o menores, respectivamente, que el valor
fijo, con la diferencia efectuada. Luego se trabaja la prueba bajo una distribución de probabilidad binomial,
con una proporción del 50%, es decir,   .50, con el estadístico de prueba x, definido por el número de signos
positivos ().
b) Cuando no se cuenta con ese valor fijo, se establece la elección sobre sólo dos alternativas, por ello se considera
de nuevo llevar la prueba bajo una distribución de probabilidad binomial con la equidad de posibilidades, es
1
decir, nuevamente π = = .50 , o sea que el estadístico de prueba x siendo el número de signos positivos ().
2
En ambos casos, la regla de decisión cambia según el tipo de prueba que se aplique.
Para una prueba de dos extremos, la regla de decisión analítica se establece de la siguiente forma con x el
número de éxitos:
n
Si x < y P ( X ≤ x cuando π = .50) ≤ α H0 se rechaza.
2
n
Si x > y P ( X ≥ x cuando π = .50) ≤ α H0 se rechaza.
2
Para una prueba de un extremo, la regla de decisión analítica se establece de la siguiente forma con x como el
número de éxitos.
Prueba de extremo izquierdo P(X  x cuando   .50)   ⇒ H0, se rechaza
Prueba de extremo derecho P(X  x cuando   .50)   ⇒ H0, se rechaza
Para el caso de una muestra de diferencias grande n  20, se establece la prueba de una distribución muestral
π (1 − π )
de proporciones aproximada por la distribución de probabilidad normal con parámetros µπ = π y µπ =
n
Procedimiento de la prueba
• e determina el signo de la diferencia entre los dos datos de cada pareja, pero previamente se
S
ha establecido un orden en la muestra que está constituida por las parejas, es decir, cuál es el
primer dato y cuál es el segundo dato, de acuerdo con el contexto del problema o la naturaleza de
la información.
• e determina el valor de “n”, es decir, el número de parejas cuyas diferencias exhiben un signo,
S
con lo cual se establece que aquellas parejas con igual valor tienes una diferencia de cero; luego
entonces no deben ser consideradas en el conteo de los signos.
• Se formula el planteamiento de la hipótesis.
• e aplica la aproximación a una distribución normal con el resto de los pasos de una prueba de
S
hipótesis, cuando n es de más de 20 pares ordenados.

En prueba de hipótesis del signo se ensaya H0:   0, contra una H1, sobre la base de una muestra aleatoria
de tamaño pequeño n  20, donde se sustituye cada valor de la muestra mayor que 0 con un signo positivo
y cada valor de la muestra menor que 0 con un signo negativo. Los valores que coincidan con 0 habrán de
descartarse del análisis, y el número de signos positivos y negativos será el nuevo valor de n a utilizar en las
tablas respectivas para la resolución del problema.
Ejemplo 12.5
Una compañía turística desea comprobar la calidad de uno de sus productos de excursiones para exportación,
que se promociona con un promedio de 8200 dólares en el mercado internacional. Para ello se consideraron 16
paquetes de excursiones en el mercado internacional con la finalidad de obtener el precio en dólares al que
fueron ofertados. Los resultados obtenidos se mostrarán en la siguiente tabla:
8 140 8 150 8 020 8 230 8 100 8 170 8 430 8 200

8 130 8 120 8 510 8 010 8 200 8 020 8 650 8 190
Pruebe que el precio promedio en dólares de una excursión en el mercado internacional es menor al promocionado
con   5%.
Solución
Al aplicar la prueba del signo, anotamos un signo positivo por cada dato con valor que exceda los 8200 dólares
y un signo negativo por cada dato con valor menor de 8200 dólares, con lo que se obtienen los siguientes
resultados:
8 140 8 150 8 020 8 230 8 100 8 170 8 430 8 200 8 130 8 120 8 510 8 010 8 200 8 020 8 650 8 190
       0     0   
Tabla 12.1 Anotación del precio menor al promocionado por medio de signos, del ejemplo 12.5
El número de ensayos válidos para este análisis es de n  14, ya que dos se descartaron al no dar un signo, sino
cero, por ser del mismo valor que el proporcionado al 8200 dólares.
El número de signos positivos x será el estadístico de prueba, luego x  4
B(X  4; 14, .50)  .0898 por tablas, puesto que es prueba de un extremo izquierdo.
  5%
En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, la prueba de una diferencia
para el promedio poblacional.
Siguiendo los pasos de toda prueba de hipótesis, se tiene el algoritmo siguiente:
H0 : µ = 8200 el precio promedio de la excursión en el mercado internacional es el promocionado.

H1 : µ < 8200 el precio promedio es menor al promocionado.

Regla de decisión: H0 se rechaza si P(X  4)  . Ahora, como P(X  4)  .0898 y es mayor a   .0500 ⇒ H0,
se acepta.
Conclusión: Existe evidencia significativa establece que el precio promedio de la excursión en el mercado in-
ternacional es el promocionado.
Ahora, si observamos con cuidado las hipótesis siguientes:

H 0 : µ = µ0 H 0 : µ = µ0 H 0 : µ = µ0
H1 : µ ≠ µ0 H1 : µ > µ0 H1 : µ < µ0

se notará que la situación de promedio comparado con un valor fijo es equivalente a una selección de dos op-
ciones o que el dato es mayor que un valor determinado o menor, es decir, el caso se analizará mediante una
1
distribución binomial con parámetros n  20 y π =
2
Ejemplo 12.6
Una empresa productora de jugos desea realizar un estudio de preferencia del consumidor sobre su producto de
manzana M1 ya que un competidor lanzó en el mercado local un nuevo producto de manzana M2, por lo que se
obtiene una muestra de 12 individuos a quienes se les da a probar ambos productos de manera aleatoria. Los
resultados obtenidos se indican en la siguiente tabla:
Consumidor 1 2 3 4 5 6 7 8 9 10 11 12
Preferencia M1 M2 M1 M2 M1 M1 M1 M1 M1 M1 M1 M1
Pruebe si hay preferencia hacia uno u otro producto bajo un nivel de significancia del .05
Solución
Sea H la proporción de consumidores que favorecen a un producto cualquiera de los dos.
Los datos de preferencia de los consumidores se definieron bajo el signo más () si el consumidor seleccionaba
el producto M2 y un signo menos () si seleccionaba el producto M1.
Preferencia M1 M2 M1 M2 M1 M1 M1 M1 M1 M1 M1 M1
Signo            
Tabla 12.2 Anotación del tipo de preferencia por medio de signos, del ejemplo 12.6
Los 12 consumidores del estudio mostraron una preferencia particular por un producto, ninguno mostró un gusto
indistinto por los productos y se observó que sólo dos consumidores marcaron su preferencia por el producto
M2, por lo que deberemos probar la hipótesis nula para una prueba de dos extremos, luego habrá que obtener
1
P(X  2) o P(X  10) con n  12 y π = = .50 ; por tablas, se obtiene que P(X  2)  .0192 y P(X  10)  .0192
  5%. 2

En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, concretar la prueba de una
diferencia para la proporción poblacional.
H0 : π = .50 no existe diferencia entre las preferencias de los dos productos.

H1 : π ≠ .50 existe diferencia entre las preferencias de los dos productos.
Como el nivel de significación es del 5% y la prueba es de dos extremos, la regla de decisión analítica está dada
por lo siguiente:
1
Puesto que 2  6 y .0192  .05 ⇒ H0 se rechaza, luego H1 se acepta.
2
Conclusión: Sí hay diferencia entre las preferencias de los dos productos comparados, ya que los consumidores
encuestados prefieren el producto M1 al tener éste mayor frecuencia en la preferencia.
Por otro lado, si recordamos que en la distribución de probabilidad binomial cuando n p y n q son
cada una al menos 5, es decir, la muestra es grande n  20, entonces será posible aproximar a la
distribución binomial por la distribución normal estándar.
Ejemplo 12.7
Consideremos el resultado de una comunidad de 40 universitarios de primer año, donde se evalúa la eficacia de
dos tipos de grupos escolares: grupos numerosos a cargo de profesores de tiempo completo o grupos pequeños
a cargo de asistentes graduados. Las respuestas fueron obtenidas con la siguiente indicación: Califica la efica-
cia en la transmisión del conocimiento en estos dos tipos de grupos con la siguiente escala: excelente, 4; muy
bueno, 3; bueno, 2, y deficiente, 1. Los resultados obtenidos se presentan en la siguiente tabla:

Número de miembro Puntuación a grupos Puntuación a grupos

de la comunidad numerosos pequeños
1 2 3
2 1 2
3 4 2
4 4 3
5 3 4
6 3 2
7 4 2
8 2 1
9 4 3
10 1 1
11 3 2
12 3 3
13 4 4
14 4 4
15 4 3
16 1 2
17 1 3
18 2 2
19 2 3
20 4 3
21 4 1
22 4 4
23 4 3
24 3 3
25 3 2
26 2 2
27 3 1
28 4 1
29 3 1
30 4 3
31 3 2
32 1 2
33 4 4
34 3 4
35 2 3
36 2 3
37 2 1
38 1 1
39 3 4
40 3 2

Si la oficina del rector quiere probar la hipótesis de que no hay diferencia entre la percepción de los alumnos
sobre ambos tipos de grupos, a un nivel de significancia del 5%, a qué conclusión se llegaría.
Solución
Comenzaremos convirtiendo en signos las evaluaciones de ambos métodos de enseñanza en los dos tipos de
grupos. Aquí, un signo  significa que el alumno prefiere grupos numerosos, un signo  significa una preferencia
a grupos pequeños, mientras un cero representa un empate o la ausencia de preferencia, lo cual será mostrado
en la siguiente tabla:
Puntuación a grupos numerosos Puntuación a grupos pequeños Signo de la puntuación

(1) (2) (1)  (2)
2 3 
1 2 
4 2 
4 3 
3 4 
3 2 
4 2 
2 1 
4 3 
1 1 0
3 2 
3 3 0
4 4 0
4 4 0
4 3 
1 2 
1 3 
2 2 0
2 3 
4 3 
4 1 
4 4 0
4 3 
3 3 0
3 2 
2 2 0
3 1 
4 1 
3 1 
4 3 
3 2 
1 2 
4 4 0
3 4 
2 3 
2 3 
2 1 
1 1 0
3 4 
3 2 
Tabla 12.3 Anotación del tipo de preferencia por medio de signos del ejemplo 12.7
Número de signos  19
Número de signos  11
Número de ceros 10
Total 40
Tabla 12.4 Resumen de signos de las 40 evaluaciones
Puesto que estamos por probar diferencias percibidas, excluiremos las evaluaciones empatadas, es decir, aquellas
que nos dieron un valor de cero. Por lo mismo, quedan 30 diferencias donde la proporción de que la primera
19
puntuación sea mayor a la segunda es de π = = .6333
30
Ahora se establece estadísticamente que si no hay diferencia de preferencia entre ambos tipos de grupos, cabe
esperar que se obtuvieran 15 signos más y 15 signos menos. Lo anterior indica que la probabilidad de que la primera
puntuación sea mayor que la segunda será de un 50%, es decir, el parámetro proporción toma ese valor:   .50.
Continuando con los conceptos necesarios para realizar la prueba de hipótesis para la proporción, bajo una
aproximación a la distribución normal, se tiene lo siguiente:
Calculando el error estándar de la proporción, se tiene:
π (1 − π ) (.50)(.50)
σπ = = = .00833 ≅ .0913
n 30
Para determinar los valores críticos, que son dos porque se desea realizar una prueba de dos extremos, bajo
la distribución Normal estándar, se busca en las tablas correspondientes los valores equidistantes de la media
que nos den un área de 95%, ya que el nivel de significación es de 5% repartido en ambos extremos, siendo
estos ZC   1.96.
En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, hay que conocer la prueba
de una diferencia para la proporción poblacional.
H0 : π = .50 No hay diferencia entre los dos tipos de grupos.
H1 : π ≠ .50 Hay diferencia entre los dos tipos de grupos.
R.R.
R.R. R. A.
α/2 = .025 α/2 = .025
1 α = 95%
4 3 2 1 0 1 2 3 4
ZC= 1.96 ZC= 1.96
Figura 12.3 Regla de decisión gráfica en unidades estandarizadas
Aceptar H0 si − 1.96 ≤ Zp ≤ 1.96

12.4 Prueba del rango con signo de Wilcoxon 531
El cálculo del valor de prueba por el modelo correspondiente es:

π − π .6333 − .5000
Zp = = ≅ 1.46
σπ .0913
Ahora, como Zp  1.46 cae en el intervalo (1.96, 1.96) ⇒ H0 se acepta.
Conclusión: El rector debe aceptar la evidencia estadística no significativa que indica que no hay diferencia en
cuanto a preferencia entre los dos tipos de grupos, los numerosos y los pequeños.
La principal desventaja de la prueba del signo radica, como ya se enuncio en desventajas de las
pruebas no paramétricas, en el hecho de que ignora la magnitud de la diferencia entre pares de va-
lores por completo. En 1945, Frank Wilcoxon desarrolló una prueba diferente a la prueba del signo
donde sí toma en consideración la magnitud de las diferencias; la llamó prueba del rango con signo.
12.4 Prueba del rango con signo de Wilcoxon
Como ya se planteó, esta prueba toma en consideración la magnitud de la diferencia absoluta entre pares de
valores. En consecuencia, se sabe que se relaciona con la dirección y la magnitud de las diferencias.
La prueba es posible utilizarla en lugar de la prueba paramétrica t de Student para una muestra en la cual se
necesita probar una hipótesis en relación con un parámetro que refleja una tendencia central. Tal prueba no
paramétrica es conocida como prueba de rangos con signos de Wilcoxon, la cual se maneja cuando se tienen
datos medidos a un nivel más alto que una escala ordinal. Cuando se violan las suposiciones de la prueba t,
la prueba de Wilcoxon, que hace menos suposiciones y menos estrictas, es pertinente usarla para detectar las
diferencias significativas.
Las suposiciones necesarias para efectuar esta prueba de Wilcoxon son las siguientes:
• Que los datos obtenidos se midan a un nivel más alto que el de escala ordinal.
• Que el fenómeno aleatorio de interés genere una variable continua.
• Que los datos se seleccionen en forma aleatoria e independiente.
• ue la distribución de las diferencias entre los datos observados y la mediana hipotética sea
Q
aproximadamente simétrica.
La prueba de Wilcoxon, de rangos con signo de una muestra, considera no sólo si un valor observado es o no
mayor (menor) que la mediana hipotética, sino también qué tan grande (pequeña) es.
• e determina el signo de la diferencia entre los dos datos de cada pareja, previamente establecido
S
un orden en la muestra que está constituida por las parejas, es decir, cuál es el primer dato y cuál
es el segundo dato, de acuerdo con el contexto del problema o la naturaleza de la información. Si

no hay parejas, y es un solo conjunto de datos de tamaño ń , se obtienen las diferencias entre cada
uno de los valores observados y la mediana hipotética M0, lo cual se denota como Di = X i − Med
donde i  1, 2, 3, ... ń
• o se toman en cuenta los signos más ni menos para obtener un grupo de ń diferencias absolutas;
N
en lenguaje simbólico, se tiene Di = X i − Med , donde i  1, 2, 3, .... ń
• ualquier par con diferencia absoluta de cero no será considerado, es decir, se omite cualquier
C
diferencia absoluta con puntaje de cero, con lo cual se tiene un conjunto de n diferencias absolutas
de puntajes distintos de cero, entonces n  ń .
• oner por rango (orden creciente) las diferencias absolutas entre pares de valores, desde la menor
P
hasta la mayor, es decir, a la diferencia absoluta menor se le asigna el rango 1, a la siguiente en
aumento el rango 2 y así sucesivamente. Lo anterior significa que se asignan rangos Ri desde
1 hasta n a cada una de las |Di|, de modo que el puntaje más pequeño obtenga el rango 1 y el
puntaje mayor obtenga el rango n.
• omo las diferencias son absolutas, entonces no se toma en consideración su signo, por lo que
C
algunas parejas tendrán un rango con el mismo valor; luego el rango a asignarse en este caso
debe ser el valor del promedio de las posiciones a las que pertenecen, es decir, debido a la falta de
precisión en el proceso de medición, si dos o más Di son iguales, se les asigna el “rango promedio”
de los rangos que se les asignarían individualmente si no hubieran ocurrido empates en los datos.
• na vez que a las diferencias se les ha asignado un rango con orden creciente, el signo de la
U
diferencia se indica en su rango para posteriormente sumar los rangos positivos y los rangos
negativos por separado. Lo anterior significa que se vuelve a asignar el símbolo  o el  a cada
uno de los n valores absolutos, distintos de las diferencias de puntajes |Di| según si Xi  Med
fue positiva o negativa.
La prueba de hipótesis para una mediana M0 de la población es de un extremo o de dos extremos.
En lenguaje simbólico se tendría lo siguiente:
Prueba de un extremo izquierdo Prueba de un extremo derecho Prueba de dos extremos
H0 mediana  Med H0: mediana  Med H0: mediana  Med

H1 mediana  Med H1: mediana  Med H1: mediana  Med
• Tomando de nuevo en cuenta el signo de las diferencias, deberán sumarse, por una parte, todos
los valores de orden (rango) positivos, a los que se denotará por W + = ∑ R i ( + ) , en tanto que la
suma de todos los valores de orden negativos serán denotados por W − = ∑ R i ( − ) . Además, habrá
que definir a W como el mínimo de (W , W ).
• a idea de Wilcoxon se fundamenta en que si la hipótesis nula se establece como H 0: µ A = µB y
L
fuera verdadera, entonces el total de la suma de rangos positivos W debería ser aproximadamente
igual al total de la suma de rangos negativos W. En consecuencia se rechazará la hipótesis
nula a favor de la hipótesis alternativa denotada por H 1: µ A ≠ µB si ambos totales (W, W) son
pequeños en una prueba de dos extremos (bilateral).
• a hipótesis nula se rechazará en favor de una hipótesis alternativa en una prueba de un extremo
L
(unilateral) si sucede, por ejemplo, lo siguiente:
H1:A  B sólo si sucede que W es pequeña y W es grande.
H1:A  B sólo si sucede que W es grande y W es pequeña.

Como los términos pequeño y grande son vagos, Wilcoxon y Wilcox elaboraron una tabla especial
con valores críticos para esta prueba, con n  5, la cual se encuentra en los anexos.
En cualquier caso, la hipótesis nula se rechazará si el valor de prueba W, W o W, según
corresponda al tipo de prueba, es menor o igual al valor crítico, como se indica en la siguiente tabla:
Tipo de prueba valor de

prueba
Extremo izquierdo W
Extremo derecho W
Dos extremos W
Tabla 12.4 Valor de W+, W– o W que se debe seleccionar en cada tipo de prueba
• tra alternativa para la obtención del valor de prueba de Wilcoxon surge al considerar la suma de
O
los rangos con signo positivo o la suma de rangos con signo negativo; en lenguaje simbólico, serí
R W = ∑ R i ( + ) o R W = ∑ R i ( − ) , en tanto que para muestras con n  8, este valor de prueba tiene
aproximadamente un comportamiento de una distribución normal y se llega a utilizar el modelo
R W − σ RW
siguiente para determinarlo Zp = donde la nomenclatura es:
σ RW
RW  suma de los rangos positivos, es decir, RW  Ri ().
n ( n + 1)
MR  valor de la media de RW, donde µRW = .
W 4
n ( n + 1) ( 2n + 1)
R  error estándar de RW, donde σ RW = .
W 24
n  número de puntajes de diferencias absolutas con valor no cero en la muestra.
n ( n + 1)
RW −
Así el valor de prueba queda establecido por el siguiente modelo Zp = 4 y al
n ( n + 1) ( 2n + 1)
24
considerar el valor del nivel de significación dado, es posible rechazar (aceptar) la hipótesis nula
si el valor calculado de Zp cae en la región apropiada de la zona de rechazo (aceptación), según
se utilice una prueba de un extremo o de dos extremos.
Ejemplo 12.8
Se seleccionan aleatoriamente diez pares de niños de una estancia infantil, cada par formado de acuerdo con su
fecha de nacimiento. Se dividen en dos grupos, un niño de cada par se coloca en el grupo I y el otro en el grupo
II. Se emplean dos dietas diferentes para alimentar a los dos grupos y después de cierto tiempo se registran sus
aumentos de peso en gramos como se muestra en la siguiente tabla:

Número de Aumento de peso con las dos dietas

pares de niños X (Grupo I) Y Grupo II)
1 15 12
2 16 20
3 19 34
4 20 22
5 14 21
6 18 16
7 17 26
8 21 20
9 17 22
10 13 21
Tal información proporciona suficiente evidencia estadística para probar que la dieta correspondiente al grupo I
es menos efectiva, en cuanto al aumento de peso, que la dieta del grupo II. Utilice un nivel de significación del 5%.
Solución
Comenzaremos determinando las diferencias de pesos para indicar los signos correspondientes; en seguida,
los rangos sin signo y por último el resto de la información de acuerdo con el procedimiento ya descrito, para
establecerlo en la siguiente tabla:
Aumento de peso con las dos dietas Rango con signo

X Y XY Rango Negativos Positivos
15 12 +3 4 4
16 20 4 5 5
19 34 15 10 10
20 22 2 2.5 2.5
14 21 7 7 7
18 16 +2 2.5 2.5
17 26 9 9 9
21 20 +1 1 1
17 22 5 6 6
13 21 8 8 8
Totales 47.5 7.5
Tabla 12.5 Anotación de diferencias con signo, así como rangos sin y con signo del ejemplo 12.8

Puesto que estamos por probar diferencias, excluiremos las evaluaciones empatadas, es decir, aquellas que nos
dieron un valor de cero. En este ejemplo no ocurrió, por lo que n  10 diferencias. Además, obsérvese que las
diferencias absolutas del cuarto y sexto pares son las mismas, luego el rango a asignarles es el promedio de los
2+3 5
rangos que les corresponden, segundo y tercero, para obtener = = 2.5
2 2
También obsérvese que como se quiere probar que la dieta correspondiente al grupo I (X) es menos efectiva,
en cuanto al aumento de peso, que la dieta del grupo II (Y), entonces la diferencia X  Y se espera tenga signo
negativo y que el valor absoluto de la suma de signos negativos sea mayor que el promedio de las dos sumas
absolutas, que será por lo tanto, la media.
47.5 + 7.5 55
µRW = = = 27.5
2 2
Si continuamos con los conceptos necesarios para realizar la prueba de hipótesis para la variable rango con
signo bajo una aproximación a la distribución normal, tendremos lo siguiente:
n ( n + 1) 10 (10 + 1) 110
µRW = = = = 27.5
4 4 4
σ RW =
n ( n + 1) ( 2n + 1)
=
( )
10 (10 + 1) 2 (10) + 1
=
10 (11)( 21)
=
2310
≅ 9.81
24 24 24 24
Sea R W = ∑ R i ( − ) la suma de los rangos negativos, considerando su valor de la tabla 12.5: R W = −47.5
El valor crítico, al establecer una prueba de extremo izquierdo, con un nivel de significación del 5%, es decir,
  .05 por tablas correspondientes a la normal estándar, se tiene que es ZC = −1.645
En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, la prueba de rangos con
signo de extremo izquierdo bajo la aproximación a la distribución normal estándar.
Si seguimos los pasos de toda prueba de hipótesis, tendremos el algoritmo siguiente:
La hipótesis nula es que ambas dietas son igualmente efectivas.
La hipótesis alternativa es que la dieta utilizada para el grupo I, o sea X, es menos efectiva que la del grupo II,
o sea Y, en cuanto al aumento de peso en los niños.
En lenguaje simbólico, con diferencia, sería lo siguiente:
H0 : X − Y = 0
H1 : X − Y < 0
R.R.
α = 5%
R. A.
1 α= 95%
4 3 2 1 0 1 2 3 4
–Zc = –1.64

Aceptar H0 si zp ≥ −1.645
Cálculo del valor de prueba por el modelo correspondiente, con diferencias sin valor absoluto:
R W − µ RW −47.5 − 27.5 −75
Zp = = = ≅ −7.64
σ RW 9.811 9.811
Como Zp = −7.64 < −1.645 , entonces se localiza en la región de rechazo ⇒ H0 se rechaza luego H1 se acepta.
Conclusión: La información proporciona evidencia estadística significativa para establecer que la dieta
correspondiente al grupo II es más efectiva, en cuanto al aumento de peso, que la dieta del grupo I.
La solución por la otra alternativa, al considerar que como el tamaño de la muestra es mayor que 5,
es decir, n  5, se logra aplicar la tabla de rangos con signo de Wilcoxon.
Lo anterior se presentará en el siguiente ejemplo con la misma información:
Ejemplo 12.9
Se seleccionan aleatoriamente diez pares de niños de una estancia infantil, cada par formado de acuerdo con su
fecha de nacimiento. Luego se dividen en dos grupos, un niño de cada par se coloca en el grupo I (X) y el otro
en el grupo II (Y). Se emplean dos dietas diferentes para alimentar a los dos grupos; después de cierto tiempo,
se registran sus aumentos de peso en gramos X y Y, como se muestra en la siguiente tabla:
Número de Aumento de peso con las dos dietas

pares de niños
X (Grupo I) Y (Grupo II)
1 15 12
2 16 20
3 19 34
4 20 22
5 14 21
6 18 16
7 17 26
8 21 20
9 17 22
10 13 21
La información proporciona suficiente evidencia estadística para probar que la dieta correspondiente al grupo I es
menos efectiva, en cuanto al aumento de peso, que la dieta del grupo II. Utilice un nivel de significación del 5%.

Solución
Comenzaremos por determinar las diferencias de pesos indicando los signos correspondientes. En seguida pa-
saremos a los rangos sin signo y por último el resto de la información de acuerdo con el procedimiento descrito,
para establecerlo en la siguiente tabla:
Aumento de peso con las dos dietas Rango con signo

X Y XY Rango Negativos Positivos
15 12 3 4 4
16 20 4 5 5
19 34 15 10 10
20 22 2 2.5 2.5
14 21 7 7 –7
18 16 2 2.5 2.5
17 26 9 9 9
21 20 1 1 1
17 22 5 6 6
13 21 8 8 8
Totales 47.5 7.5
Tabla 12.6 Anotación de diferencias con signo, así como con rangos sin y con signo del ejemplo 12.9
Puesto que estamos por probar diferencias, excluiremos las evaluaciones empatadas, es decir, aquellas que nos
dieron un valor de cero. En este ejemplo no ocurrió lo anterior, por lo que n  10 diferencias. Además, obsérvese
que las diferencias absolutas del cuarto y sexto pares son las mismas. Luego el rango a asignarles es el promedio
2+3 5
de los rangos que les corresponden, segundo y tercero, para obtener = = 2.5 .
2 2
En seguida, a partir de la tabla 12.6, y luego de establecer que al realizar una prueba de extremo izquierdo o una
prueba unilateral se aplica la tabla de rangos con signo de Wilcoxon, conjuntamente con los datos del tamaño de
la muestra y el nivel de significación, es decir, en lenguaje simbólico, n  10 y   .05, se obtiene que WC  11.
El procedimiento para el uso de la tabla de rangos con signo de Wilcoxon, es similar al de algunas distribuciones
de probabilidad ya trabajadas, en el caso paramétrico, se cruzan el renglón correspondiente al tipo de prueba y
nivel de significación con la columna que indica el valor del tamaño de muestra, como se observa en seguida en
un fragmento de dicha tabla:
Unilateral Bilateral n5 n6 n7 n8 n9 n  10

P  0.05 P  0.10 1 2 4 6 8 11
P  0.025 P  0.05 1 2 4 6 8
P  0.01 P  0.02 0 2 3 5
P  0.005 P  0.01 0 2 3
Tabla 12.7 Fragmento de la tabla especial de Wilcoxon para n  10,   .05 y prueba unilateral

Si continuamos con los elementos para efectuar la prueba, tocará establecer la regla de decisión, la cual, bajo la
teoría de este método alternativo, es rechazar H0 si Wp  WC. La consideración del valor de prueba está dado
por el tipo de prueba: extremo izquierdo (Tabla 12.4) luego Wp  W   7.5, ahora como 7.5  11, entonces H0
se rechaza y, por consiguiente, se acepta H1
Conclusión: Hay evidencia estadística no significativa para establecer que la dieta correspondiente al grupo I
es menos efectiva, en cuanto al aumento de peso, que la dieta del grupo II.
12.5 Pruebas de suma de rangos
Tales pruebas son útiles para resolver problemáticas que ocurren a menudo en estudios de investigación de
mercados, así como en comportamiento de consumidores y de psicología experimental, donde sólo se llegan
a obtener datos del tipo ordinal; por consiguiente, la prueba paramétrica correspondiente la t de Student
en dos muestras no es aplicable por no cumplirse todos las suposiciones estrictas de que las muestras sean
independientes, que sean éstas elegidas de poblaciones con comportamiento según una distribución normal,
que tengan estas últimas variancias iguales conocidas y que los datos se midan cuando menos con la fuerza de
una escala de intervalo.
Por otra parte, quien desea aplicar la teoría paramétrica correspondiente a la t de Student y consiga obtener los
datos con las propiedades de una escala de intervalo o una proporción, tendrá la sensación y la impresión de
que los supuestos de la prueba a utilizar t son irreales para el conjunto de datos.
En esas circunstancias, es posible hacer uso de pruebas no paramétricas como son: la de Wilcoxon, la de
Kruskal-Wallis y la de U Mann Withney de suma de rangos, las cuales han demostrado ser casi tan poderosas,
en condiciones apropiadas, como su contraparte paramétrica, la distribución t de Student.
12.5.1 Prueba de Wilcoxon
Dicha prueba fue diseñada para detectar cualquier clase de diferencia entre dos grupos; algunas de ellas son:
ubicación, dispersión, forma, o las tres. Es posible usarla cuando se ha logrado una medición de la información
en cuando menos escala ordinal y se desea probar que dos muestras mutuamente independientes se han tomado
o no de la misma población o de poblaciones idénticas.
Los únicos supuestos necesarios para aplicar la prueba son los siguientes:
• Para evitar empates que la variable aleatoria de interés sea continua.

• ue los datos a recopilar cuando menos tengan una escala ordinal de medición, tanto entre como
Q
dentro de las dos muestras.
• ue ambas muestras sean elegidas en forma aleatoria e independiente de sus respectivas
Q
poblaciones.
En resumen, el procedimiento de la prueba de Wilcoxon de suma de rangos requiere un conjunto de suposiciones

menos estrictas que la prueba t de Student, ya que sólo se especifica que las poblaciones tengan distribución
continua con la misma forma sesgada o simétrica, así como que los datos se logren medir en una escala ordinal
en ambas muestras.

12.5 Pruebas de suma de rangos 539
Suele ser de interés usar la prueba de suma de rangos de Wilcoxon en forma específica para probar
diferencias en la posición, es decir para las diferencias de medianas poblacionales.
Para llevar a cabo la aplicación de la prueba de suma de rangos de Wilcoxon, se debe seguir los siguientes puntos.
• l tamaño de las muestras será denotado respectivamente a partir de cómo fueron proporcionadas
E
o elegidas las muestras; la primera como n1 y la segunda como n2. Por consiguiente, los rangos
combinados serán en número n1  n2 lo que se denota por n  n1  n2.
• Se debe establecer siempre que los tamaños de las muestras sean desiguales, n1 representará la
muestra con menos elementos o la más pequeña, mientras n2 será la muestra con más elementos
o la más grande.
• oner por rangos combinados todos los datos de ambas muestras, desde el menor hasta el mayor, es
P
decir, al dato menor se le asigna el rango 1, al siguiente en aumento el rango 2 y así sucesivamente,
salvo por supuesto que los datos obtenidos ya tuvieran los rangos inicialmente asignados.
• l valor de prueba para la prueba de Wilcoxon de suma de rangos es sólo la suma de los rangos
E
asignados a los n1 datos de la muestra más pequeña, lo que es denotado por Sn1.
• ara muestras de igual tamaño es posible seleccionar cualquier muestra para la determinación
P
de Sn1.
• Ahora, como matemáticamente se sabe que la suma de los primeros n enteros positivos consecutivos
n ( n + 1)
se obtiene por la expresión general , entonces el estadístico para la prueba Sn1, más la
2
suma de los rangos asignados a los n2 datos de la muestra grande Sn2, debe ser igual a este valor.
En lenguaje simbólico se tendría lo siguiente:
n ( n + 1)
Sn1 + Sn2 = , ecuación que servirá para verificar el punto a seguir para asignar los rangos.
2
• Cuando en las muestras sus tamaños n1 y n2, por separado, son menores o iguales a 10, se suele
usar una tabla de valores críticos de la suma de rangos de Wilcoxon (véase los anexos) con el
valor de prueba de Sn1, ya sea que la prueba es de uno o de dos extremos, con diversos niveles
de significación.
• ara muestras de tamaño grande, n1 y n2 por separado son estrictamente mayores a 10. El
P
estadístico para la prueba Sn1 tiene un comportamiento aproximado de una distribución normal.
Luego, los parámetros a utilizar en la prueba están dados por los siguientes modelos:
n ( n + 1) n1n 2 ( n + 1)
µS n = σSn =
1 2
1 12
Por lo anterior, el valor de prueba queda de la siguiente forma, con n1  n2

Sn1 − µS n
Zp = 1
σSn
1
La prueba de hipótesis para dos medianas M1 y M2 de la población sería de un extremo o de dos extremos. En
lenguaje simbólico quedaría así:

Prueba de un extremo izquierdo Prueba de un extremo derecho Prueba de dos extremos

H0 : M1 ≥ M 2 H0 : M1 ≤ M 2 H0 : M1 = M 2
H1 : M1 < M 2 H1 : M1 > M 2 H1 : M1 ≠ M 2

en donde:
M1  a la mediana de la población de la que se seleccionaron n1 datos de la primera muestra, que es la más
pequeña.
M2  a la mediana de la población de la que se seleccionaron n2 datos de la segunda muestra, que es la más
grande.
Ejemplo 12.10
Un analista financiero desea comparar el rendimiento en dividendos de ciertas emisiones negociadas en la bolsa
de valores durante los dos años consecutivos últimos. Para ello, se seleccionan muestras de ocho y diez papeles
para cada año, respectivamente, en orden cronológico, con los resultados presentados en la siguiente tabla:
Bolsa de valores penúltimo año Bolsa de valores último año

Dividendos Precio Dividendos Precio
por acción por acción por acción por acción
$ 1.30 $ 14.25 $ 2.00 $ 20.38
.24 14.75 .80 14.25
.18 3.40 1.00 18.25
.12 8.75 .50 7.75
.80 8.25 .22 8.00
.60 11.88 1.59 16.75
.32 3.88 .80 17.12
.35 3.12 3.60 33.25
1.08 15.50
.60 8.25
Solución
Comenzaremos determinando los rendimientos de dividendos, en seguida los rangos combinados de los
rendimientos de dividendos y por último el resto de la información, de acuerdo con el procedimiento anteriormente
descrito, en la siguiente tabla:

Bolsa de valores penúltimo año n1  8 Bolsa de valores último año n2  10

Dividendos Precio Rango Dividendos Precio Rango
Rendimiento Rendimiento
por por combinado de por por combinado de
de dividendos de dividendos
acción acción (1) rendimientos de acción acción (1) rendimientos de
(1) (2) (2) dividendos (1) (2) (2) dividendos
$ 1.30 $ 14.25 9.1% 13 $ 2.00 $ 20.38 9.8% 16
.24 14.75 1.6 2 .80 14.25 5.6 8
.18 3.40 5.3 6 1.00 18.25 5.5 7
.12 8.75 1.4 1 .50 7.75 6.5 9
.80 8.25 9.7 15 .22 8.00 2.8 3
.60 11.88 5.1 5 1.59 16.75 9.5 14
.32 3.88 8.2 12 .80 17.12 4.7 4
.35 3.12 11.2 18 3.60 33.25 10.8 17
1.08 15.50 7.0 10
.60 8.25 7.3 11
Sn1  72 Sn2  99
Tabla 12.8 Anotación de rendimientos de dividendos y rangos combinados del ejemplo 12.10
Recordemos que el rendimiento de dividendos se encuentra establecido por la razón entre los dividendos y el
precio por acción.
Si al analista financiero le interesa en forma específica la comparación de la mediana de producción de divi-

dendos, más bien que sólo las diferencias que hubiera en la generación de los rendimientos de dividendos, se
debe suponer que la distribución de los rendimientos de los dividendos en ambas poblaciones, de las cuales
se tomaron muestras aleatorias, habrán de ser idénticas, excepto quizá por las diferencias en ubicación como
son las medianas.
Por lo anterior y para saber la prueba que se realizará, calculemos las medianas de los rendimientos de los divi-
dendos para cada una de las muestras, para lo cual hay que seguir el procedimiento de un listado, acercándonos
a la posición central a partir de los extremos, que en ambos casos serán dos valores los que se ubiquen en ellas,
por ser las dos muestras en cantidad un número par.
5.3 + 8.2 13.5
n1 = 8 1.4 , 1.6 , 5.1 , 5.3, 8.2, 9.1 , 9.7 , 11.2 Mediana = = = 6.75
2 2
6.5 + 7.0 13.5
n 2 = 10 2.8, 4.7, 5.5 , 5.6 ,6.5,7.0, 7.3 , 9.5 , 9.8 , 10.8 Mediana = = = 6.75
2 2
Con lo obtenido y que el analista financiero tampoco especifico cuál de los dos grupos es viable que posea un
mayor (menor) rendimiento mediano de dividendos, la prueba será de dos extremos.
Ahora se efectuará la verificación del proceso de asignación de rangos combinados, entendiendo esto como que se
van a considerar todos los datos como un todo y no muestra por muestra en forma separada, con el planteamiento

n ( n + 1)
visto en la teoría de que se use la ecuación siguiente: Sn1 + Sn2 = . En consecuencia, al tener las sumas
2
de los rangos ya determinadas para cada muestra en la tabla 12.8, se cumplirá que:
n ( n + 1)
Sn1 + Sn2 =
2
18 (18 + 1)
72 + 99 =
2
18 (19)
171 =
2
171 = 171
Por último, y antes de iniciar la prueba, se determinarán los valores críticos de ésta a partir de las tablas ela-
boradas por estadísticos para muestras pequeñas (menores o iguales de diez elementos cada una), su uso es
similar a otras ya trabajadas como son la t de Student, la ji cuadrada y la normal estándar, por mencionar algunas.
En este caso, para la prueba de Wilcoxon de suma de rangos, se consideran varios valores: uno en la columna
externa, que es el tamaño de la muestra grande n2, mientras en el renglón superior de los dos primeros valores
se elige el que va de acuerdo con el tipo de prueba para luego bajar por él hasta el valor del nivel de significa-
ción y, junto con el valor inicialmente elegido, se marca una línea horizontal, que se va a interceptar con la línea
vertical correspondiente al valor del tamaño de la muestra pequeña n1.
Tal procedimiento quedará visualizado con un fragmento de dicha tabla, para el ejemplo en cuestión, seguido
con los datos ya enunciados, que remarcaremos aquí:
Prueba de dos extremos, nivel de significación del 5%, es decir,   .05, n1  8 y n2  10.
 n1
n2
Un extremo Dos extremos 7 8 9
.05 .10 (43,76) (54,90) (66,105)
.025 .05 (40,79) (51,93) (62,109)
9 .01 .02 (37,82) (47.97) (59,112)
.005 .01 (35,84) (45,99) (56,115)
.05 .10 (45,81) (56.96) (69,111)

10 .025 .05 (42,84) (53,99) (65,115)
.01 .02 (39,87) (49,103) (61,119)
.005 .01 (37,89) (47,105) (58,122)
Tabla 12.9 Fragmento de la tabla para obtener valores críticos de la prueba de Wilcoxon

de suma de rangos para muestras pequeñas

En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, la prueba de suma de rangos
de Wilcoxon de dos extremos.
Si seguimos los pasos de toda prueba de hipótesis, se tiene el algoritmo siguiente:

H0 : M1 = M 2 Las medianas de rendimiento de dividendos son iguales.
H1 : M1 ≠ M 2 Las medianas de rendimiento de dividendos son diferentes.
Ahora, como los valores críticos inferior y superior, respectivamente, para una prueba de dos extremos son los
obtenidos en la tabla anterior, con valores (53,99), así como el valor de prueba es la suma de rangos de la muestra
más pequeña, entonces se tiene a Sn1  72.
La regla de decisión, por ser prueba de dos extremos, se establece simbólicamente como lo siguiente:
Aceptar H0 si L i ≤ Sn1 ≤ Ls
Entendamos que el valor Sn1  72 se encuentra dentro del intervalo, que es la región de aceptación, es decir,
53 ≤ Sn1 ≤ 99
Conclusión: Se establece que hay evidencia estadística de que las medianas de rendimiento de dividendos son
iguales en esos dos años consecutivos.
El ejemplo anterior fue para muestras menores o iguales a 10, es decir, pequeñas. En seguida se establecerá
uno para muestras grandes o con tamaños estrictamente mayores a diez.
Ejemplo 12.11
Un cierto banco desea analizar si los saldos promedio en cuentas de cheques de sus clientes, en dos de sus
sucursales en dos delegaciones distintas del Distrito Federal, son idénticos. Por ello, el gerente de planeación
toma dos muestras aleatorias simples e independientes, una en cada sucursal. Los datos obtenidos se presentan
en la siguiente tabla:
Saldos en cuentas de cheques para dos sucursales en un cierto banco

Sucursal 1 Sucursal 2
Saldos promedio en dólares Saldos promedio en dólares
885 1095
850 955
915 1200
950 1195
800 925
750 950
865 805
1000 945
1050 875
935 1055
1025
975

¿Indican estos datos que las poblaciones de los saldos promedio de cuentas de cheques de las dos sucursales
son idénticas? Pruebe a un nivel de significancia del 5%.
Solución
Comenzaremos determinando los rangos combinados de los saldos promedio de cuentas de cheques para las
dos sucursales, luego haremos lo mismo que el ejemplo anterior con el resto de la información, pero siguiendo
el procedimiento descrito para muestras grandes obteniendo la siguiente tabla:
Sucursal 1 Rangos Sucursal 2 Rangos

Saldos promedio combinados Saldos promedio combinados
en dólares en dólares
885 7 1095 20
850 4 955 14
915 8 1200 22
950 12.5 1195 21
800 2 925 9
750 1 950 12.5
865 5 805 3
1000 16 945 11
1050 18 875 6
935 10 1055 19
1025 17
975 15
Sn1  83.5 Sn2  169.5
Tabla 12.10 Anotación de rangos combinados de los saldos promedio en cuentas de cheques del ejemplo 12.11
Antes de continuar, es pertinente establecer los datos con que se cuenta hasta este momento del desarrollo de
solución del problema.
n1  10, n2  12, n  n1 1 n2  22, Sn1  83.5, Sn2  169.5 y Sn1 1 Sn2  253
Ahora es conveniente verificar si lo que se ha realizado hasta el momento es correcto. Para efectuar la verifica-
ción del proceso de asignación de rangos combinados, entendiendo esto como que se van a considerar todos los
datos como un todo y no muestra por muestra en forma separada, se planteó que se use la ecuación siguiente:
n ( n + 1)
Sn1 + Sn2 =
2

12.5 Pruebas n ( n +de
1) suma de rangos 545
Sn1 + Sn2 =
2
22 ( 22 + 1)
83.5 + 169.5 =
2
22 ( 23)
253 =
2
253 = 253
Ahora continuamos con los conceptos necesarios para realizar la prueba de hipótesis para la variable suma de
rangos de Wilcoxon, bajo una aproximación a la distribución normal, se tendrá lo siguiente:
n1 ( n + 1) 10 ( 23)
µSn1 = = = 5 ( 23) = 115
2 2
n1 n 2 ( n + 1) 10 (12) ( 23)
σ Sn1 = = = 230 ≅ 15.166
12 12
Por lo que el valor de prueba queda de la siguiente forma, con n1  n2:

Sn1 − µSn1 83.5 − 115
Zp = = ≅ −2.08
σ Sn1 15.166
El valor crítico, al establecer una prueba de dos extremos, con un nivel de significación del 5%, es decir,   .05
por tablas correspondientes a la normal estándar, se tiene que ZC   1.96.
de Wilcoxon de dos extremos bajo la aproximación de la distribución normal estándar.
H0: Las poblaciones de los saldos promedio de cuentas de cheques de las dos sucursales son idénticas.
H1: Las poblaciones de los saldos promedio de cuentas de cheques de las dos sucursales son diferentes.
R.R.
R.R. R. A.
α/2 = .025 α/2 = .025
1 α = 95%
4 3 2 1 0 1 2 3 4
ZC= 1.96 ZC= 1.96
Aceptar H0 si − 1.96 ≤ Zp ≤ 1.96

Como el valor de prueba ya fue calculado previamente y es de Zp ≅ −2.08 entonces este valor no cae en el
intervalo (1.96, 1.96) por ser 2.08  1.96 ⇒ H0 se rechaza luego H1 se acepta.
Conclusión: Hay evidencia estadística no significativa que indica que las poblaciones de los saldos promedio
de cuentas de cheques de las dos sucursales difieren.
12.5.2 Prueba U de Mann Whitney

La prueba se usa para constatar si dos muestras independientes han sido seleccionadas de la misma población
o de poblaciones diferentes que poseen el mismo comportamiento, bajo una distribución de probabilidad, es
decir, que sus medias son iguales. La prueba, a diferencia de la de Wilcoxon, no se fundamenta en muestras
pareadas, es decir, muestras en las que se obtienen dos observaciones para el mismo individuo o fenómeno. Es
otra de las pruebas no paramétricas poderosas, aunque es la alternativa a la prueba del signo, ya que con ella no
se pierde información al utilizar la ordenación por rangos combinados. De nuevo, es la contraparte de la prueba
paramétrica t de Student que permite evitar las suposiciones que exige la prueba paramétrica: varianzas iguales
o distribuciones simétricas, y que la medición sea más vaga que la escala de intervalo. Si este último supuesto
(la simetría) se elimina, la mediana debe reemplazar a la media como estadístico de prueba.
La prueba U de Mann Whitney tiene como finalidad contrastar la igualdad de las distribuciones de
probabilidad de dos muestras independientes y determinar si éstas provienen o no de la misma
población; por lo tanto, se comparan sus medias o bien sus medianas.
• rdenar por rangos combinados todas las puntuaciones en orden creciente, es decir, hay que
O
considerar de corrido ambos datos de las dos muestras.
• I ndicar al lado de cada valor del rango un símbolo relacionado con la característica que corresponde
a cada muestra, ya que es lo que se desea relacionar del problema a resolver y probar.
• Después, se obtiene la suma de rangos para cada muestra.
• El valor de prueba U resulta al usar los valores de los tamaños de las muestras n1 y n2 mientras
la suma de rangos de los elementos de la primera o segunda muestras están denotadas por R1 y
R2, respectivamente, según el tipo de prueba de un extremo o de dos extremos. Las expresiones
siguientes establecen el valor de prueba respectivo.
n1 ( n1 + 1) n ( n + 1)
U 1 = n 1n 2 + − R1 y U 2 = n 1 n 2 + 2 2 − R2
2 2
• ara verificar la obtención de la suma de rangos y de los valores de prueba se debe cumplir la
P
siguiente relación: U1 U2  n1 n2, que es un comportamiento análogo a la prueba de suma de
rangos de Wilcoxon.
•
l comportamiento de esta prueba U, cuando el tamaño de ambas muestras por separado es mayor
E
de diez elementos, es decir, en lenguaje simbólico n1  10 y n2 10 (muestras grandes), es una
aproximación por la distribución normal con media y error estándar establecidas por los siguientes
modelos:
nn n1 n 2 ( n1 + n 2 + 1)
µU = 1 2 σU =
2 12

En consecuencia el valor de prueba queda de la siguiente forma:

U − µU
Zp =
σU

• stablecimiento del nivel de significación para obtener el valor crítico o los valores críticos, lo que
E
depende si es prueba de un extremo o de dos extremos.
• ambién, para el caso de muestras grandes, la prueba se realiza no en unidades estandarizadas,
T
sino en datos originales, bajo el despeje de U en el cambio de variable Z, así como determinando
límites inferior y superior, según el tipo de prueba que se necesite realizar de un extremo o de
dos extremos, por lo que queda el modelo en lenguaje simbólico de la siguiente forma:
U I = µU − ZCσ U y U S = µU + ZCσ U
Además, la regla de decisión se prueba con el valor de U1 o U2.
Lo anterior es establecido conjuntamente con el tipo de prueba, como se muestra en la siguiente
tabla:
Valor de
H0 H1
prueba
1  2 1  2 U1
1  2 1  2 U2
1  2 1  2 Ui
Tabla 12.11 Valor adecuado del estadístico en cada tipo de prueba y en datos originales
El dato Ui es el valor adecuado, en algunos casos se elige el más pequeño en cantidad de estos
dos valores de prueba U1 y U2.
• Si n1 y n2 son extrictamente menores a 10, en lenguaje simbólico n1  10 y n2  10, es decir, se

consideran como muestras pequeñas, los valores críticos de esta prueba U deberán buscarse en la
tabla de T correspondiente (véase anexos), donde n1 indica el tamaño de la muestra cuya suma de
rangos se emplea en la prueba, es decir, R1 o R2 y el valor de Ti inferior se obtiene directamente de
la tabla, luego con su valor se obtiene el deTs superior a partir del modelo Ts  n1 (n1  n2  1)  Ti.
• i Ti ni Ts están en la región de rechazo de la regla de decisión para la hipótesis nula, entonces
N
si las poblaciones son idénticas se debe rechazar sólo cuando la Ri de prueba sea estrictamente
menor que Ti o estrictamente mayor que Ts El subíndice “i” indica que la selección correspondiente
está de acuerdo con lo que se éste probando; por ejemplo, la muestra indicada como la primera
tendrá el subíndice “1”, aunque se localice en la información como la segunda.
Ejemplo 12.12
Supóngase que la junta de gobierno de una universidad desea demostrar que las puntuaciones promedio que
los estudiantes obtuvieron en una prueba de aptitudes académicas, aplicada por un organismo externo, en dos
ramas de todas las que ofrece en las diversas carreras que se imparten en esa casa de estudios, son diferentes.
La junta conserva bases de datos con los resultados de esas pruebas de los alumnos en todas las ramas de su
sistema educativo. Se seleccionan aleatoriamente dos muestraa de igual tamaño de 15 alumnos pertenecientes
cada una a cada rama por analizar, los datos que se obtuvieron se presentan en la tabla siguiente:

Rama “A” 1000 1100 800 750 1300 950 1050 1250 1400 850 1150 1200 1500 600 775
Rama “S” 920 1120 830 1360 650 725 890 1600 900 1140 1550 550 1240 925 500
Utilice un nivel de significación del 10%.
Solución
Comenzaremos por identificar que el material teórico a utilizar, para resolver lo planteado, es la prueba U de
Mann Whitney para muestras grandes. Se tendría, en lenguaje simbólico,n1 y n2  10. Luego hay que determinar
las puntuaciones, los rangos en orden creciente de ambas muestras mezcladas en una sola, por último, a que
rama pertenecen, lo cual se establece en la siguiente tabla:
Puntuación Rango Rama Puntuación Rango Rama

500 1 S 1 000 16 A
550 2 S 1 050 17 A
600 3 A 1 100 18 A
650 4 S 1 120 19 S
725 5 S 1 140 20 S
750 6 A 1 150 21 A
775 7 A 1 200 22 A
800 8 A 1 240 23 S
830 9 S 1 250 24 A
850 10 A 1 300 25 A
890 11 S 1 360 26 S
900 12 S 1 400 27 A
920 13 S 1 500 28 A
925 14 S 1 550 29 S
950 15 A 1 600 30 S
Tabla 12.12 Puntuaciones de la prueba de aptitudes académicas clasificadas en orden creciente, así como rangos
combinados y rama a la que pertenecen, del ejemplo 12.12
Para continuar con el procedimiento ya descrito, se retorna a la separación de las dos muestras con sus respec-
tivos rangos combinados, para así obtener las sumas de los rangos combinados, denotados respectivamente
como R1 y R2, lo cual se indica en la siguiente tabla:

Rama “A” Rango Rama “S” Rango

n1 15 combinado n2 = 15 combinado
1 000 16 920 13
1 100 18 1 120 19
800 8 830 9
750 6 1 360 26
1 300 25 650 4
950 15 725 5
1 050 17 890 11
1 250 24 1600 30
1 400 27 900 12
850 10 1 140 20
1 150 21 1550 29
1 200 22 550 2
1 500 28 1 240 23
600 3 925 14
775 7 500 1
R1  247 R2  218
Tabla 12.13 Anotación de rangos combinados y suma de estos para el ejemplo 12.12
Ahora se procederá a determinar los conceptos necesarios para realizar la prueba de hipótesis para la variable
“puntuaciones de una prueba estándar en dos ramas diferentes”, bajo una aproximación por la distribución
normal. Con los datos ya obtenidos en las tablas auxiliares anteriores, se tiene lo siguiente:
n1  n2  15, R1  247 y R2  218
n1n 2 15 (15) 225

µU = = = = 112.5
2 2 2
n1n 2 ( n1 + n 2 + 1) (15)(15)(15 + 15 + 1) = (225)(31) = 6975
σU = = = 581.25 ≅ 24.109
12 12 12 12
Para el valor de prueba U se determinan los valores de U1 y U2, bajo la teoría se considera para U el de menor valor.
n1 ( n1 + 1) 15 (15 + 1)
U = n1 n 2 + − R1 = (15)(15) + − 247 = 225 + 120 − 247 = 98
2 2
n 2 ( n 2 + 1)
U 2 = n 1n 2 + − R 2 = 225 + 120 − 218 = 127
2
Ahora es el momento de verificar si los rangos combinados y sus sumas son correctas, al cumplirse lo establecido
en la teoría, con que.
U 1 + U 2 = n 1n 2
127 + 98 = (15)(15)
225 = 225
Los valores críticos, al establecer una prueba de dos extremos, con un nivel de significación del 10%, es decir,
  .10, por tablas correspondientes a la normal estándar se tiene que ZC   1.645.
de U Mann Whitney de dos extremos bajo la aproximación de la distribución normal estándar.
Al seguir los pasos de toda prueba de hipótesis, se tiene el algoritmo siguiente:

La hipótesis nula es que ambas muestras tienen igual promedio de puntuaciones en la prueba. La hipótesis
alternativa es que las puntuaciones de las muestras no provienen de poblaciones con promedios idénticos. En
lenguaje simbólico, y con puntuaciones promedio, sería lo siguiente:
H0 : µU1 = µU2
H1 : µU1 ≠ µU2
R.R R.R
/2 .05 R. A. /2 .05
1 α = 90%
4 3 2 1 0 1 2 3 4
Z c 1.645 Z c 1.645
Aceptar H0 si − 1.645 ≤ Zp ≤ 1.645
Cálculo del valor de prueba por el modelo correspondiente.

U − µ U 98 − 112.5 −14.5
Zp = = = ≅ −.601
σU 24.109 24.109
Ahora como Zp  .602 se localiza en el intervalo (1.645, 1.645), entonces cae en la región de aceptación ⇒
H0 se acepta.
Conclusión: La información proporciona evidencia estadística significativa para establecer que ambas muestras
tienen igual promedio de puntuaciones en la prueba o que fueron extraídas de poblaciones idénticas.
Ejemplo 12.13
Supondremos que se toma una muestra aleatoria de siete trabajadores eventuales del sector salud y otra mues-
tra aleatoria de ocho trabajadores eventuales del sector educativo en diferentes lugares del país. A cada uno
de los elementos de las muestras se les aplicó un instrumento de investigación para recabar la información en
relación con sus ingresos promedio por hora trabajada. Los datos obtenidos se indican en la siguiente tabla:

Ingreso promedio por hora Ingreso promedio por hora

Sector salud Sector educativo
$20.50 $26.00
19.00 24.00
22.00 25.00
18.00 22.40
21.00 25.80
22.50 26.70
20.00 24.60
23.00
¿Hay diferencia del ingreso promedio por hora entre trabajadores del sector salud y el sector educativo? Use un
nivel de significación del 0.05
Solución
Comenzaremos por identificar que el material teórico a utilizar para resolver lo planteado es la prueba U de Mann
Whitney para muestras pequeñas, es decir, en lenguaje simbólico, n1 y n2  10. Luego hay que determinar los
ingresos promedio por hora y los rangos en orden creciente de ambas muestras mezcladas en una sola, lo cual
se establece en la siguiente tabla:
Ingreso por hora Rango

$18.00 1
19.00 2
20.00 3
20.50 4
21.00 5
22.00 6
22.40 7
22.50 8
23.00 9
24.00 10
24.60 11
25.00 12
25.80 13
26.00 14
26.70 15
Tabla 12.14 Ingresos promedio por hora de todos los 15 trabajadores

y rangos combinados en orden creciente del ejemplo 12.13

Si continuamos con el procedimiento descrito en la teoría, retornaremos a la separación de las dos muestras
con sus respectivos rangos combinados, para así obtener las sumas de los mismos, denotados respectivamente
como R1 y R2, lo cual se indica en la siguiente tabla:
Sector Sector
Rango Rango
salud educativo
combinado combinado
n1  7 n2  8
$20.50 4 $26.00 14
19.00 2 24.00 10
22.00 6 25.00 12
18.00 1 22.40 7
21.00 5 25.80 13
22.50 8 26.70 15
20.00 3 24.60 11
23.00 9
R1  29 R2  91
Tabla 12.15 Anotación de rangos combinados y suma de estos para cada muestra del ejemplo 12.13
Ahora se procederá a determinar los conceptos necesarios para realizar la prueba de hipótesis para la variable
“ingreso promedio por hora de trabajadores en los sectores salud y educativo”, bajo la tabla T correspondiente
para la prueba U Mann Whitney, para muestras pequeñas (véase anexos). Con los datos obtenidos en las tablas
auxiliares anteriores, se tiene lo siguiente:
n1  7, n2  8, R1  29 y R2  91
Para el estadístico U, se tiene:
n1 ( n1 + 1) 7 (7 + 1)
U1 = n 1 n 2 + − R1 = (7 ) (8) + − 29 = 56 + 28 − 29 = 55
2 2
n 2 ( n 2 + 1) 8 (8 + 1)
U 2 = n 1n 2 + − R 2 = (7 )(8) + − 29 = 56 + 36 − 91 = 1
2 2
Ahora es el momento de verificar si los rangos combinados y sus sumas son correctas, al cumplirse lo establecido
en la teoría, con que U1 + U 2 = n1 n 2 . Luego se tiene que.
U1 + U 2 = n 1 n 2
55 + 1 = (7 ) (8)
56 = 56

11.3 Inferencias en regresión y correlación 553
Por último, y antes de iniciar la prueba, se determinarán los valores críticos de la misma a partir de unas tablas
elaboradas por estadísticos para muestras pequeñas o estrictamente menores de diez elementos cada una.
Para la prueba U de suma de rangos, como ya se mencionó, en este caso son para obtener valores de T y no
valores de probabilidad p. El uso de tales tablas es a partir de la consideración de varios elementos, uno en la
columna externa, que es el tamaño de la muestra pequeña n1, y en el renglón superior el tamaño de la muestra
más grande de las dos, que en este caso es n2; ambas tienen valores del 2 hasta 10.
Por último, un recuadro en el extremo superior izquierdo, donde se indica el nivel de significación (en las tablas
de los anexos sólo se cuenta con cuadros para dos valores de ) en seguida se procede a marcar una línea ho-
rizontal a partir del valor de n1,que se va a interceptar con la línea vertical que corresponde al valor de n2. Este
procedimiento quedará visualizado con un fragmento de dicha tabla, para el ejemplo en cuestión, seguida con
los datos ya enunciados, pero que remarcaremos aquí. Prueba de dos extremos, nivel de significación del .05,
es decir,   5%, n1  7 y n2  8.
n2
  5%
6 7 8 9
19 21 22 23
6 27 28 30 32
n1
7 35 37 39 41
8 45 47 50 52
Tabla 12.16 Fragmento de la tabla para obtener valores críticos de la prueba de suma de rangos
de U Mann Whitney para muestras pequeñas
Si continuamos con los elementos necesarios para realizar la prueba de dos extremos, tendremos los valores
críticos con un nivel de significación del 5%; además, con el uso de la tabla 12.16 (que es un fragmento de las
tablas correspondientes) se obtendrá el valor crítico inferior, que es Ti  39. Ahora con ese valor determinaremos
TS, valor representado por TS = n1 ( n1 + n 2 + 1) − Ti = 7 (7 + 8 + 1) − 39 = 73
de U Mann Whitney de dos extremos, bajo la tabla de T para muestras pequeñas.
Si seguimos los pasos de toda prueba de hipótesis, obtendremos el algoritmo siguiente:
La hipótesis nula es que ambas muestras tienen igual promedio de ingresos por hora. La hipótesis alternativa
es que el ingreso promedio por hora de los trabajadores en el sector salud (µU1) es diferente al ingreso promedio
por hora de los trabajadores en el sector educativo (µU2).
En lenguaje simbólico, seria así:

H0 : µU1 = µU2
H1 : µU1 ≠ µU2

La regla de decisión, por ser prueba de dos extremos, se establece simbólicamente como:
Aceptar H0 si Ti  R1 o R2  TS para el ejemplo 39  R1 o R2  73
Identifiquemos que tanto el valor R1  29 como el valor R2  91 no se encuentran dentro del intervalo, que es
la región de aceptación, es decir, no es válido que 39  29  73, ni que 39  91  73 ⇒ H0 se rechaza, luego
H1 se acepta.
Conclusión: Hay evidencia estadística significativa de que el ingreso promedio por hora de los trabajadores en
el sector salud es diferente al ingreso promedio por hora del trabajador en el sector educativo.
12.6 Prueba de Kolmogorov–Smirnov
La prueba no paramétrica de Kolmogorov–Smirnov es la contraparte de la distribución ji cuadrada, para el caso

de bondad de ajuste en las pruebas paramétricas, ya que se desea probar que no hay diferencia en la distribu-
ción de las frecuencias observadas ni en la distribución de frecuencias teóricas, esperadas o estimadas. Esto
es, lo que interesa es el grado de ajuste entre la distribución de un conjunto de valores de una muestra, que son
los puntajes observados, y alguna distribución teórica especifica. Asimismo, establece si razonablemente se
logra plantear que los puntajes en la muestra provengan de una población con la distribución teórica a probar.
La prueba no paramétrica de Kolmogorov – Smirnov es muy fácil de usar, puesto que no requiere que los datos
sean agrupados en determinada forma.
El estadístico de la prueba no paramétrica de Kolmogorov – Smirnov tiene una distribución de

probabilidad que depende del tamaño de la muestra “n” y será denotado como Dks. Más aún, la
distribución Dks es independiente de la distribución de frecuencias teóricas o esperadas, por lo que
éste se utiliza cuando se desea ver cuánto se acerca la distribución de frecuencias observadas a la
distribución de frecuencias teóricas.
Al aplicar la prueba de Kolmogorov – Smirnov hacemos uso de una distribución de frecuencias acumuladas
relativas para cada muestra de frecuencias, como son las observadas (fear)y las estimadas (fear), con los mismos
intervalos para ambas distribuciones.
• Ordenar los datos en forma creciente con sus respectivas frecuencias observadas.
• I ndicar al lado de cada valor las frecuencias teóricas correspondientes a la descripción del com-
portamiento que se desea probar sigue la información de la muestra, ya que es lo que se desea
ajustar del problema a resolver.
• l valor de prueba de esta teoría de Kolmogorov – Smirnov se establece o define como la máxima
E
desviación absoluta entre la frecuencia esperada acumulada relativa y la frecuencia observada
acumulada relativa. En lenguaje simbólico, se establecería la expresión siguiente:
Dks  Máxima|fear  foar|

12.6 Prueba de Kolmogorov–Smirnov 555

donde fear es la frecuencia esperada, o teórica acumulada relativa, y foar es la frecuencia observada
acumulada relativa, es decir, es el punto en el que las dos distribuciones, la teórica y la observada,
muestran la mayor divergencia.
• l comportamiento de esta prueba va de acuerdo con la distribución que se desea probar, misma
E
que siguen los datos recopilados en una sola muestra.
• Establecimiento del nivel de significación para obtener el valor crítico DC con tablas correspon-
dientes a una prueba de Kolmogorov – Smirnov para una muestra.
• iempre es una prueba de un extremo derecho, como la prueba paramétrica Ji cuadrada, pero sólo
S
se ha construido una tabla que es para dos extremos, por lo que será en la que nos apoyaremos.
Ejemplo 12.14
Una compañía telefónica cuenta con un equipo automático que se usa para intercambios. Lleva un control de esos
intercambios llamados “emisores”, con los que en un determinado momento se seleccionan 3754 emisiones, con
la finalidad de planear la inversión de capital. El jefe del departamento de presupuesto en la compañía afirma
que el patrón de uso sigue una distribución de Poisson, con un promedio de emisiones recibidas o trabajadas
de 8.8. Él quiere establecer su afirmación como una hipótesis y probarla a un nivel de significación del 1%, para
lo que utiliza una prueba no paramétrica como es la de Kolmogorov – Smirnov. La recopilación de la información
de la muestra se indica en la siguiente tabla:
Números Frecuencia
ocupados observada
0 0
1 4
2 15
3 25
4 56
5 112
6 196
7 277
8 379
9 417
10 462
11 432
12 414
13 357
14 220
15 144
16 110
17 56
18 44
19 15
20 8
21 7
22 4

Solución
Comenzaremos por determinar las frecuencias observadas acumuladas y seguiremos con las frecuencias
observadas acumuladas relativas fear.
Números Frecuencia Frecuencia Frecuencia

ocupados observada observada observada
acumulada acumulada
relativa
0 0 0 .0000
1 4 4 .0011
2 15 19 .0051
3 25 44 .0117
4 56 100 .0266
5 112 212 .0565
6 196 408 .1087
7 277 685 .1825
8 379 1 064 .2834
9 417 1 481 .3945
10 462 1 943 .5176
11 432 2 375 .6327
12 414 2 789 .7429
13 357 3 146 .8380
14 220 3 366 .8966
15 144 3 510 .9350
16 110 3 620 .9643
17 56 3 676 .9792
18 44 3 720 .9909
19 15 3 735 .9949
20 8 3 743 .9971
21 7 3 750 .9989
22 4 3 754 1.0000
Tabla 12.17 Emisiones del equipo y las frecuencias observadas acumuladas relativas foar, que pertenecen al ejemplo 12.14

Ahora, para determinar las frecuencias teóricas, se tienen dos alternativas; la que es la más rápida y consiste en
usar las tablas de la distribución de Poisson para   8.8 y la otra que es cuando no se cuenta con tablas y hay
que apoyarse en una calculadora para obtenerla bajo el modelo de la distribución de Poisson en forma analítica
e− λ λ x
P (X = x) = , con todos los casos de la variable posibles para obtener probabilidades con aproximaciones
x!
a cuatro decimales significativos.
Números Frecuencia Frecuencia

ocupados esperada esperada
relativa relativa
acumulada
0 .0002 .0002
1 .0013 .0015
2 .0058 .0073
3 .0171 .0244
4 .0377 .0621
5 .0663 .1284
6 .0972 .2256
7 .1222 .3478
8 .1344 .4822
9 .1315 .6137
10 .1157 .7294
11 .0925 .8219
12 .0679 .8898
13 .0459 .9357
14 .0289 .9646
15 .0169 .9815
16 .0093 .9908
17 .0048 .9956
18 .0024 .9980
19 .0011 .9991
20 .0005 .9996
21 .0002 .9998
22 .0001 .9999
Tabla 12.18 Emisiones del equipo y las frecuencias teóricas esperadas relativas acumuladas fear con  = 8.8 del ejemplo 12.14

Al comparar estas frecuencias teóricas con las anteriores, se observa el grado de diferencias que hay entre
ellas, para así llegar a obtener sus desviaciones absolutas, que son las diferencias entre las frecuencias espe-
radas acumuladas relativas y las frecuencias observadas acumuladas relativas, es decir, en lenguaje simbólico:
|fear  foar| como se enuncia en la siguiente tabla:
Frecuencia Frecuencia
Frecuencia observada Frecuencia esperada Desviaciones
Números Frecuencia
observada acumulada esperada relativa absolutas
ocupados observada
acumulada relativa relativa acumulada |fear  foar|
foar fear
0 0 0 .0000 .0002 .0002 .0002
1 4 4 .0011 .0013 .0015 .0003
2 15 19 .0051 .0058 .0073 .0022
3 25 44 .0117 .0171 .0244 .0127
4 56 100 .0266 .0377 .0621 .0355
5 112 212 .0565 .0663 .1284 .0719
6 196 408 .1087 .0972 .2256 .1169
7 277 685 .1825 .1222 .3478 .1653
8 379 1 064 .2834 .1344 .4822 .1988
9 417 1 481 .3945 .1315 .6137 .2192
10 462 1 943 .5176 .1157 .7294 .2118
11 432 2 375 .6327 .0925 .8219 .1892
12 414 2 789 .7429 .0679 .8898 .1469
13 357 3 146 .8380 .0459 .9357 .0977
14 220 3 366 .8966 .0289 .9646 .0680
15 144 3 510 .9350 .0169 .9815 .0465
16 110 3 620 .9643 .0093 .9908 .0265
17 56 3 676 .9792 .0048 .9956 .0164
18 44 3 720 .9909 .0024 .9980 .0071
19 15 3 735 .9949 .0011 .9991 0042
20 8 3 743 .9971 .0005 .9996 .0025
21 7 3 750 .9989 .0002 .9998 .0009
22 4 3 754 1.0000 .0001 .9999 .0001
Tabla 12.19 emisiones del equipo, frecuencias teóricas relativas acumuladas fear, frecuencias observadas
acumuladas relativas foar y desviaciones absolutas de ellas, del ejemplo 11.24
Nota: recordemos que acumulada relativa es lo mismo que relativa acumulada.

Los valores críticos, con el establecimiento de una prueba de dos extremos y un nivel de significación del 1%,
es decir, α 2 = .005 por tablas correspondientes a la prueba de Kolmogorov – Smirnov para una muestra, serán
determinados por el cruce de un renglón perteneciente al tamaño de la muestra, que en este caso es n  3 754,
y una columna con el valor del nivel de significación, que en este caso es   .01, se muestra todo lo descrito
en un fragmento de dicha tabla.
Tamaño Nivel de significación 

de muestra
n .10 .05 .01
16 .295 .328 .392

17 .286 .318 .381
18 .278 .309 .371
19 .272 .301 .363
20 .264 .294 .356
25 .24 .27 .32

30 .22 .24 .29
35 .21 .23 .27
1.22 1.36 1.63

Más de 35
n n n
Tabla 12.20 F ragmento de la tabla para obtener valores críticos de la prueba

de Kolmogorov – Smirnov para una muestra
1.63 1.63
En consecuencia, se tiene que DC = = = .0266
n 3754
En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, usar la aplicación de la
prueba de Kolmogorov – Smirnov para una muestra.
Si seguimos los pasos de toda prueba de hipótesis, se tendrá el algoritmo siguiente:
La hipótesis nula: Una distribución de Poisson con   8.8 es una buena descripción del patrón de equipo para
el intercambio telefónico. La hipótesis alternativa: Una distribución de Poisson con   8.8 no es una buena
descripción del patrón de equipo para el intercambio telefónico.

R.R.
R.R.
R.A. α/2=.005
α/2=.005
1 − α = 99%
−Dc =-.0266 Dc =.0266
Figura 12.7 Regla de decisión gráfica en unidades de la tabla correspondiente

a la prueba de Kolmogorov – Smirnov
Aceptar H0 si − .0266 ≤ Dks ≤ .0266
El cálculo del valor de prueba, como está dado por el modelo correspondiente, debe ser la máxima desviación
absoluta, por lo que se localiza en la última tabla que contiene las desviaciones absolutas, de donde:
Dks = Máxima fear − foar = .2192
Ahora como Dks  .2192 se localiza fuera del intervalo (.0266, .0266), entonces cae en la región de rechazo ⇒
H0 también se rechaza, pero H1 se acepta.
Conclusión: La información proporciona evidencia estadística significativa para establecer que una distribución
de Poisson, con una media de 8.8 emisiones, no es una buena descripción del comportamiento de uso por parte
del equipo para el intercambio telefónico.
Ejemplo 12.15
Un inspector de una delegación política en la ciudad de México investiga el cumplimiento, por parte de los
propietarios de condominios, seis puntos específicos del régimen condominal. El inspector desea probar, al
elegir una muestra de 200 condominios en la delegación en estudio, que el número de violaciones reales por
condominio es una variable aleatoria que se comporta según una distribución binomial. La muestra arrojó los
resultados presentados en la siguiente tabla:
Número de violaciones Número

posibles de condóminos
0 10
1 31
2 45
3 70
4 20
5 15
6 9
Ayude al inspector y realice la prueba correspondiente con un nivel de significancia del 5%.

Solución
Comenzaremos por determinar las frecuencias observadas acumuladas y posteriormente las frecuencias obser-
vadas acumuladas relativas foar en una primera tabla.
Número de Frecuencia Frecuencia Frecuencia

violaciones observada observada observada
posibles acumulada acumulada
relativa
0 10 10 .0500
1 31 41 .2050
2 45 86 .4300
3 70 156 .7800
4 20 176 .8800
5 15 191 .9550
6 9 200 1.0000
Tabla 12.21 Número de condóminos y frecuencias observadas acumuladas relativas foar

que pertenecen al ejemplo 12.15
Nota: es de hacer notar que para obtener foar se debe tomar el tamaño de la muestra a veces denotado por n.
Ahora, para determinar las frecuencias teóricas, contamos con dos alternativas, una que es la más rápida,
consistente en usar las tablas de la distribución binomial para n  6 y la probabilidad de éxito que en estos
momentos se desconoce, pero se obtendrá en seguida, y la otra, que es cuando no hay tablas se debe apoyar
en una calculadora con la finalidad de obtener del modelo de la distribución binomial las probabilidades en
forma analítica: P ( X = x ) = ( nx ) p x q n − x , donde en todos los valores de la variable las probabilidades deben ir con
aproximaciones a cuatro decimales significativos.
Nota: bajo la Distribución Binominal el simbolo n denota el número de ensayos de...
Para determinar el valor de la probabilidad de éxito “p”, nos apoyamos en el concepto de la media para esta teoría
de una distribución de probabilidad binomial establecida por   n p; retomando de la estadística descriptiva,
la media muestral se define como el promedio de todos los valores de la variable. Así, al tener tales valores
algebraicamente se despeja la probabilidad de éxito. Para lo anterior, nos apoyaremos en una tabla donde se
compactará la información, que será enunciada en seguida.

Número de
Número de
violaciones
condóminos fiX
posibles
fi
X
0 10 0
1 31 31
2 45 90
3 70 210
4 20 80
5 15 75
6 9 54
∑f i = 200 ∑ f X = 540
i
Tabla 12.22 Cálculos para obtener el valor de “p” con los datos del ejemplo 12.15
Se establece que x =
∑ f X = ∑ f X = 540 = 2.7 ; así por estimación puntual  5 2.7 y como  5 np ⇒ np 5 2.7 de
i i
∑f iΝ 200
2.7 2.7
donde se despeja a p para obtener,donde p = = = .45 .
n 6
Remarcando con este parámetro se buscan las probabilidades para los valores de la variable en tablas o se obtienen
con el modelo en forma analítica para establecerlos en la siguiente tabla, conjuntamente con sus acumulamientos.
Frecuencia
Número de Frecuencia
esperada
violaciones esperada
relativa
posibles relativa
acumulada
0 .0277 .0277
1 .1359 .1636
2 .2780 .4416
3 .3032 .7448
4 .1861 .9309
5 .0609 .9918
6 .0082 1.0000
Tabla 12.23 Número de condóminos y frecuencias teóricas acumuladas relativas fear

que pertenecen al ejemplo 12.15
Al comparar estas frecuencias teóricas con las observadas, se logra identificar el grado de diferencias que
hay entre ellas y así llegar a obtener sus desviaciones absolutas, que son las diferencias entre las frecuencias

esperadas acumuladas relativas y las frecuencias observadas acumuladas relativas, es decir, en lenguaje simbólico
tendríamos: |fear  foar| como se enuncia en la siguiente tabla:
Número de Frecuencia observada Frecuencia esperada Desviaciones
Frecuencia
violaciones observada acumulada esperada relativa absolutas
observada
posibles acumulada relativa relativa acumulada |fear  foar|
foar fear
0 10 10 .0500 .0277 .0277 .0223
1 31 41 .2050 .1359 .1636 .0414
2 45 86 .4300 .2780 .4416 .0116
3 70 156 .7800 .3032 .7448 .0352
4 20 176 .8800 .1861 .9309 .0509
5 15 191 .9550 .0609 .9918 .0368
6 9 200 1.0000 .0082 1.0000 0
Tabla 12.24 Número de condóminos, frecuencias teóricas o esperadas relativas acumuladas fear frecuencias
observadas acumuladas relativas foar y desviaciones absolutas de ellas del ejemplo 12.15
La obtención de los valores críticos estableciendo una prueba de dos extremos, con un nivel de significación del
5%, es decir, ⁄ 2  .025, por tablas correspondientes a la prueba de Kolmogorov – Smirnov para una muestra,
serán determinados por el cruce de un renglón perteneciente al tamaño de la muestra, en este caso n  200,
y una columna con el valor del nivel de significación, en este caso   .05, se muestra todo lo descrito en un
fragmento de dicha tabla.
Tamaño Nivel de significación 

de muestra
n .10 .05 .01
16 .295 .328 .392
17 .286 .318 .381
18 .278 .309 .371
19 .272 .301 .363
20 .264 .294 .356
25 .24 .27 .32

30 .22 .24 .29
35 .21 .23 .27
1.22 1.36 1.63

Más de 35
n n n
Tabla 12.25 Fragmento de la tabla para obtener valores críticos de la prueba de Kolmogorov – Smirnov para una muestra

1.36 1.36
En consecuencia, se tiene que DC = = = .0962
n 200
En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, usaremos la aplicación de
la prueba de Kolmogorov– Smirnov para obtener una muestra.
Si seguimos los pasos de toda prueba de hipótesis, obtendremos el algoritmo siguiente:
La hipótesis nula: El número de violaciones por condominio en la población de todos éstos en una cierta dele-
gación está distribuido en forma binomial, con una probabilidad de éxito de 45% en cualquier ensayo.
La hipótesis alternativa: Una distribución binomial con n  6 y p  .45 no es una buena descripción del patrón
del número de violaciones por condominio en la población de todos éstos en una cierta delegación.
R.R.
R.R.
R.A. α/2=.025
α/2=.025
1 − α = 95%
-Dc =-.0962 Dc =.0962
Figura 12.8 Regla de decisión gráfica en unidades de la tabla correspondiente a la prueba de Kolmogorov – Smirnov
Acepta H0 si − .0962 ≤ Dks ≤ .0962
El cálculo del valor de prueba como está dado por el modelo correspondiente, de ser la máxima desviación absoluta,
luego se localiza en la última tabla que contiene las desviaciones absolutas, por lo que se obtiene lo siguiente:
Ahora como Dks  .0509 se localiza dentro del intervalo (.0962, .0962), entonces cae en la región de aceptación
⇒ H0 se acepta.
Conclusión: La información proporciona evidencia estadística no significativa para establecer que una distribución
binomial con n  6 y p  .45 es una buena descripción del patrón del número de violaciones por condominio en
la población de todos éstos en una cierta delegación.
Ejemplo 12.16
El departamento de admisión de un centro educativo virtual analiza el tiempo requerido que un aspirante ne-
cesita para inscribirse al examen de admisión en una plataforma. Se registran los tiempos en minutos de 164
aspirantes y se cree que el comportamiento de los tiempos sigue una Distribución Normal. Los datos obtenidos
en la muestra se indican en la siguiente tabla:

Tiempo de Número de
inscripción aspirantes
en minutos
22 8
23 13
24 19
25 26
26 31
27 25
28 19
29 14
30 9
A un nivel de significación del 5%, realice la prueba correspondiente.
Solución
Primeramente se determinan las frecuencias observadas acumuladas y luego las frecuencias observadas acu-
muladas relativas foar en una primera tabla.
Tiempo de Frecuencia Frecuencia Frecuencia

inscripción observada observada observada
en minutos acumulada acumulada
relativa
22 8 8 .0488
23 13 21 .1280
24 19 40 .2439
25 26 66 .4024
26 31 97 .5915
27 25 122 .7439
28 19 141 .8598
29 14 155 .9451
30 9 164 1.0000
Tabla 12.26 Tiempo para inscribirse y frecuencias observadas acumuladas relativas foar que pertenecen al ejemplo 12.16
Para determinar las frecuencias teóricas se tiene una sola alternativa rápida, consistente en usar las tablas
de la distribución normal estándar para los parámetros  y , que en estos momentos se desconocen, pero se

obtendrán en seguida, ya que la opción analítica requiere una computadora en lugar de la calculadora, así como
utilizar paquetería, por ejemplo de Excel, donde todos los valores de la variable y sus probabilidades deben ir
con aproximaciones a cuatro decimales significativos.
Para determinar el valor de la media y la desviación estándar poblacionales usaremos los estadísticos, con modelos
de estadística descriptiva, ya vistos en los primeros capítulos de este libro, así como la estimación puntual, es
decir, nos apoyamos en el concepto de la media, definida como el promedio de todos los valores de la variable,
y de la desviación estándar, definida como la raíz positiva del promedio de las desviaciones al cuadrado de los
datos hacia la media. Para lo anterior, nos apoyaremos en una tabla donde se compactará la información, que
será enunciada en seguida.
Tiempo de
Número de
inscripción
Aspirantes fiX fi(x 2 )2
en minutos
fi
X
22 8 176 130.5728
23 13 299 120.1480
24 19 456 79.0704
25 26 650 28.1216
26 31 806 0.0496
27 25 675 23.0400
28 19 532 72.9904
29 14 406 122.6624
30 9 270 141.1344
∑ fi  164 ∑ fiX  4270 ∑  717.7824

Tabla 12.27 Cálculos para obtener el valor de µ con los datos del ejemplo 12.16
Ahora se establece que x =

∑ f X = ∑ f X = 4270 ≅ 26.04
i i
⇒   26.04 y para  a partir de
∑f in 164
s=
∑ f (x − µ ) =
i 717.7824
≅ 2.092 y por estimación puntual  ≅ 2.092, parámetros con los que se calculan las
n 164
probabilidades para los valores de la variable con tablas y las operaciones respectivas, como se muestra en
seguida:
 22 − 26.04 
P ( X ≤ 22) = P  Z ≤ = P ( Z ≤ −1.93) = .0
0268
 2.092 
P ( 22 ≤ X ≤ 23) = P ( −1.93 ≤ Z ≤ −1.45) = .0467
P ( 23 ≤ X ≤ 24 ) = P ( −1.45 ≤ Z ≤ −.97 ) = .0925
P ( 24 ≤ X ≤ 25) = P ( −.97 ≤ Z ≤ −.50) = .1425

P ( 25 ≤ X ≤ 26) = P ( −.50 ≤ Z ≤ −.02) = .1835
P ( 26 ≤ X ≤ 27 ) = P ( −.02 ≤ Z ≤ .46) = .1852
P ( 27 ≤ X ≤ 28) = P (.46 ≤ Z ≤ .93) = .1466
P ( 28 ≤ X ≤ 29) = P (.93 ≤ Z ≤ 1.41) = .0969
P ( 29 ≤ X ≤ 30) = P (1.41 ≤ Z ≤ 1.89) = .0499
P ( X ≥ 30) = P ( Z ≥ 1.89) = .0294
Estas probabilidades se establecen en la siguiente tabla, conjuntamente con sus acumulamientos para obtener
las frecuencias teóricas o esperadas relativas acumuladas:
Frecuencia
Tiempo de Frecuencia
esperada
inscripción esperada
relativa
en minutos relativa
acumulada
22 .0735 .0735
23 .0925 .1660
24 .1425 .3085
25 .1835 .4920
26 .1852 .6772
27 .1466 .8238
28 .0969 .9207
29 .0499 .9706
30 .0294 1.0000
Tabla 12.28 Tiempo para inscribirse y frecuencias teóricas acumuladas relativas fear que pertenecen al ejemplo 11.26
Al comparar estas frecuencias teóricas con las observadas, se identifica el grado de diferencias que hay entre
ellas para así obtener sus desviaciones absolutas, que son las diferencias entre las frecuencias esperadas acu-
muladas relativas y las frecuencias observadas acumuladas relativas, es decir, en lenguaje simbólico quedaría
así: |fear  foar|, como se enuncia en la siguiente tabla.

Tiempo de Frecuencia observada Frecuencia esperada Desviaciones
Frecuencia
inscripción observada acumulada esperada relativa absolutas
observada
en minutos acumulada relativa relativa acumulada |fear  foar|
foar fear
22 8 8 .0488 .0735 .0735 .0247
23 13 21 .1280 .0925 .1660 .0380
24 19 40 .2439 .1425 .3085 .0646
25 26 66 .4024 .1835 .4920 .0896
26 31 97 .5915 .1852 .6772 .0857
27 25 122 .7439 .1466 .8238 .0799
28 19 141 .8598 .0969 .9207 .0609
29 14 155 .9451 .0499 .9706 .0255
30 9 164 1.0000 .0294 1.0000 0
Tabla 12.29 Tiempo para inscribirse, frecuencias teóricas o esperadas relativas acumuladas fear, frecuencias observadas
acumuladas relativas foar y desviaciones absolutas de ellas del ejemplo 12.16
La obtención de los valores críticos para establecer una prueba de dos extremos, con un nivel de significación
del 5%, es decir,  ⁄ 2  .025, por tablas correspondientes a la prueba de Kolmogorov–Smirnov para una muestra,
serán determinados por el cruce de un renglón perteneciente al tamaño de la muestra, en este caso n  164,
y una columna con el valor del nivel de significación, en este caso   .05, se muestra todo lo descrito en un
fragmento de dicha tabla.
Tamaño de Nivel de significación 

muestra
n .10 .05 .01
16 .295 .328 .392

17 .286 .318 .381
18 .278 .309 .371
19 .272 .301 .363
20 .264 .294 .356
25 .24 .27 .32

30 .22 .24 .29
35 .21 .23 .27
1.22 1.36 1.63

Más de 35
n n n
Tabla 12.30 Fragmento de la tabla para obtener valores críticos de la prueba de Kolmogorov – Smirnov para una muestra

Ejercicios de introducción a la estadística no paramétrica 569
1.36 1.36
En consecuencia se tiene que DC = = = .1062
n 164
En estos momentos ya es posible comenzar a dar respuesta a lo solicitado, es decir, la aplicación de la prueba
de Kolmogorov – Smirnov para una muestra.
Si se siguen los pasos de toda prueba de hipótesis, se tendrá el algoritmo siguiente:

La hipótesis nula: El tiempo requerido por un aspirante para inscribirse virtualmente al examen de admisión
está distribuido en forma normal, con parámetros µ ≅ 26.04 y  ≅ 2.092.
La hipótesis alternativa: La distribución N (26.04, 2.092) no es un buen ajuste del tiempo requerido por un as-
pirante para inscribirse virtualmente al examen de admisión.
R.R.
R.R.
R.A. α/2=.025
α/2=.025
1 − α = 95%
-Dc =-.1062 Dc =.1062
Figura 12.9 Regla de decisión gráfica en unidades de la tabla correspondiente a la prueba de Kolmogorov – Smirnov
Aceptar H0 si − .1062 ≤ Dks ≤ .1062
El cálculo del valor de prueba como está dado por el modelo correspondiente como la máxima desviación absoluta;
por consiguiente, se localiza en la última tabla que contiene las desviaciones absolutas, de donde:
Ahora como Dks  .0896 se localiza dentro del intervalo (.1062, .1062), entonces cae en la región de aceptación
⇒ H0 se acepta.
Conclusión: La información proporciona evidencia estadística significativa para establecer que la distribución
normal, con μ ≅  26.04 y  ≅ 2.098, es un buen ajuste del comportamiento de los tiempos requeridos por aspi-
rantes para inscribirse virtualmente al examen de admisión.
Ejercicios de introducción a la estadística no paramétrica
12.1 En una empresa mercantil se ha establecido una nueva política de cobro y se desea verificar si hay una
diferencia significativa entre el número de días requeridos para cobrar una cuenta antes y después de
que se estableció la nueva política. Utilice un nivel de significación del 5% para los datos obtenidos en un
cierto momento, que se encuentran establecidos en la siguiente tabla:

Antes 41 32 29 35 24 33 30 36 47 44 31 41 39 36 32
Después 39 36 35 37 29 34 38 40 46 42 33 40 42 36 40
12.2 En seguida se presentan los índices de calificaciones de 35 estudiantes de contabilidad obtenidos alea-
toriamente de una encuesta desarrollada y aplicada por el director de una institución.
2.8 2.7 2.9 2.56 2.92 3.86 2.51 2.76 3.2 3.6 2 3.2
2.93 3 3 3.62 3.18 3.09 2.48 3.12 2.73 2.55 2.1 3.54
3.17 2 3.2 2.28 3 2 2.62 2.91 3.75 2.91 2.64
Una cuestión de interés para el director es determinar si los índices de calificaciones de los estudiantes
de contabilidad habían o no cambiado en los últimos 10 años. El índice promedio de calificaciones había
sido de 2.705. Considere un nivel de significación del 5%.
12.3 Considerando los datos del ejercicio 12.2 (anterior), que son el índice de las calificaciones de estudiantes
de contabilidad, para este nuevo ejercicio se considerará otro grupo de 59 estudiantes, pero de otras
materias, cuyos índices de calificaciones se presentan en la siguiente tabla:
2 2.5 3.43 2 3.51 2.9 2.3 2.84 3.32 2.85

2.8 3.53 2.4 2.75 2.36 3.25 3.82 3.61 2.82 2.76
1.83 3 3.08 2.9 3.89 2.64 2.83 2.45 2.81 3
2.66 2.45 3.07 2.82 2.51 3.86 2.89 2.75 2.8 2.6
2.5 2.25 2.8 3.01 2.3 2.85 3.34 3.39 2.5 2.86
2.94 3.2 3.21 3.2 2.64 3 2.69 3.75 3
Utilice las dos muestras para probar si habrá o no diferencias significativas entre los índices de calificaciones
de los estudiantes de contabilidad y de los estudiantes de otras materias. Maneje un nivel de significación
del 1%.
12.4 Pruebe la hipótesis de que no hay diferencia entre las edades de profesionistas masculinos y femeninos de
cierta compañía, con los datos proporcionados en la siguiente tabla. Utilice un nivel de significación del 10%.
Mujeres 34 44 48 34 47 30 35 47 32 35
Hombres 35 31 43 38 26 25 44 35 40 42
12.5 Un vendedor de una compañía, tiene siete clientes que visitar por semana. Examine la distribución de
frecuencias observadas del número de ventas que el vendedor realiza por semana en un cierto periodo
de tiempo, los datos se indican en la siguiente tabla:
Número de ventas por semana 0 1 2 3 4 5 6 7

Frecuencia del número de ventas 25 30 60 45 40 20 16 14

Si se establece que sus ventas serán descritas, con una distribución binomial y con 45% de probabilidad
de realizar la venta a cada cliente, a un nivel de significancia del 5% pruebe que efectivamente la distri-
bución de ventas corresponde a la distribución sugerida.
12.6 En una muestra de un estudio piloto un investigador desea probar la hipótesis de que las mujeres moder-
nas piensan que el número de hijos en la familia debe ser pequeño en contraparte con lo que opinan sus
madres. Pidió a las participantes madres e hijas en el estudio responder el número de hijos que desearían
tener o el que juzgaban ser el número ideal. Las respuestas fueron anónimas para evitar un sesgo en las
respuestas al sentirse tal vez obligadas socialmente a dar una respuesta adecuada. Asimismo, para que
la muestra fuera aleatoria en su selección se incluyeron personas procedentes de diferentes niveles so-
cioeconómicos. A continuación se transcriben las respuestas de las parejas madres-hijas a lo preguntado:
Pareja muestra Tamaño ideal de la familia

Madre 1 4 3 4 2 4 2 3 3 5 5 3 3
Hija 2 3 4 4 1 2 3 1 3 5 2 4 2
¿El investigador concluiría, cuando   .03, que madres e hijas tienen esencialmente el mismo ideal
tamaño de la familia?
12.7 Una tarea en un área contable, en el pasado, ha requerido en promedio 30 minutos para llevarse a cabo.
Un contador ha desarrollado un nuevo método para llevar a cabo la tarea que acelerará el proceso según
él. Se obtiene una muestra aleatoria de 15 experimentos con un contador entrenado en el nuevo método.
Los resultados obtenidos se presentan en la siguiente tabla:
27.0 27.4 28.8 31.1 27.2 29.0 29.6 28.1

25.9 30.0 31.3 30.2 30.5 27.3 26.7
¿Hay evidencia que sugiera que el tiempo mediano con el nuevo método es significativamente menor de
30 minutos? ¿Qué recomendaría a la gerencia? Considere un nivel de significancia del 5%.
12.8 Una organización pro ayuda a las mujeres desea saber si difieren los salarios mensuales iniciales de hom-
bres y mujeres profesionistas al ingresar a una empresa. Se seleccionó para ello una muestra aleatoria de
10 egresados varones con calificación promedio de 8 y otra muestra aleatoria de 9 egresados mujeres con
calificación promedio de 8. A cada profesionista se le permitió un total de tres entrevistas con empresas
de relaciones comerciales, mercadotecnia o publicidad. Los datos siguientes son las mejores ofertas sa-
lariales hechas a esos profesionistas:
Hombres
14 15 11.8 12.5 17 10.5 13 14.5 14 15.2
miles de pesos
Mujeres
12 9 11.25 13.1 12.75 10.25 10 14.2 11.5
miles de pesos
¿Hay alguna evidencia que apoye la aseveración de que a las mujeres profesionistas se les paga igual que
a los hombres profesionistas cuando sus aptitudes son similares? Utilice un nivel de significancia del 5%.

12.9 Para aumentar las ganancias, una cadena de tiendas que vende un producto lácteo en centros comerciales
obsequia porciones pequeñas del producto en la entrada de los locales los días que la gerencia define
como de gran afluencia de clientes y selecciona aleatoriamente los días para regalar esas porciones del
producto llamadas muchas veces muestras. En una muestra aleatoria de días, dentro y fuera de la cate-
goría de los días en que se debe obsequiar una porción del producto, se registran las ventas del producto
en una tienda, las cuales se enuncian en la siguiente tabla:
Ventas en cientos
Días de promoción 18 19 21 18 27 21 20 23 22 15 18 26 17
Días normales 21 17 23 22 17 15 16 23 24 25 26 20
Efectúe una prueba a un nivel de significación del 5% para decidir si regalar porciones pequeñas del
producto en la entrada de las tiendas produciría mayores ventas.
12.10 El gerente de una empresa de productos de limpieza personal ha reunido las siguientes estadísticas de
sueldos respecto de los ingresos de su equipo de ventas. Por lo anterior, tiene frecuencias observadas y
esperadas donde la distribución de los ingresos, que son presentados en la siguiente tabla, se comporta
según una distribución normal:
Ingresos
fo fe
000 pesos
5 – 10 10 6
11 – 16 21 17
17 – 22 25 32
23 – 28 31 35
29 – 34 20 18
34 – 40 11 13
41 – 46 7 4
A un nivel de significación del 10%, ¿la afirmación del gerente que la distribución de los ingresos de la
fuerza de ventas se ajusta a una distribución normal se acepta o se rechaza?
12.11 En dos sucursales de una tienda departamental, que son idénticas físicamente, se analiza el número de
demandas en diez meses, seleccionados al azar, por un seguro de gastos médicos de parte de los emplea-
dos. La información recopilada se muestra en la siguiente tabla:

Número de demandas mensuales

por un seguro de gastos médicos
Mes Sucursal A Sucursal B
1 170 201
2 164 179
3 140 159
4 184 195
5 174 177
6 142 170
7 191 183
8 169 179
9 161 170
10 200 212
¿Proporcionan los datos evidencia suficiente para establecer una diferencia en el número de demandas
para las dos sucursales? Efectúe la prueba correspondiente con un valor de  cercano a 0.10
12.12 Supóngase que una empresa comercializadora de productos para el hogar establece que la capacidad
media de cierto tipo de producto es de 140 volts por hora. Una agencia independiente de estudios de
protección al consumidor desea probar la credibilidad de lo afirmado por la firma y mide la capacidad de
una muestra elegida aleatoriamente de 20 productos de un embarque reciente. Los resultados obtenidos
se presentan en la siguiente tabla:
138.2 133.5 137.0 140.0 138.3 139.0 144.5 139.1 141.7 137.3
134.1 136.3 141.1 139.2 136.5 135.6 136.5 138.0 140.9 140.6
Pruebe con un nivel de significación del 5%.
12.13 La cantidad en miles de pesos invertida en publicidad, específicamente en cadenas y en estaciones de
televisión locales por 10 empresas, se presenta en la siguiente tabla:
Empresa Televisión Cadena de

local televisión
1 $13 181 $18 359
2 49 259 44 642
3 17940 24 152
4 36860 46 507
5 16 320 27 479
6 26 355 40 791
7 18 960 15 273
8 20893 38 554
9 16 944 15 527
10 11 491 36 685

Use un nivel de significación del 5% y pruebe si los datos indican que los publicistas prefieren uno de los
medios televisivos sobre el otro.
12.14 Un gran corporativo comercial contrata a casi todo su personal en dos grandes universidades de la ciudad.
En el último año empezaron a administrar una prueba a licenciados en relaciones comerciales (LRC) recién
titulados que ingresaban al corporativo, ya que deseaban determinar cuál escuela educaba mejor a sus
profesionistas. Con base en una muestra aleatoria de las puntuaciones de 100 puntos posibles, obtenidos
en la prueba, ayude al personal del corporativo a averiguar si las escuelas difieren en calidad. Utilice un
nivel de significación del 6%. La información de las muestras es la que se presenta en la tabla siguiente:
Puntuaciones de la prueba
Escuela A 92 76 84 73 69 97 90 88 84 87 93
Escuela B 84 97 69 65 99 88 85 89 91 90 87 91 72
12.15 En una empresa de servicios de alimentos a líneas áreas, el jefe del área administrativa examinó los regis-
tros de 200 vuelos seleccionados aleatoriamente y determinó la frecuencia con que se pedían alimentos
con poco sodio. El número de vuelos en que se pidieron 1, 2, 3, 4 o más comidas con poco sodio fueron,
respectivamente, 23, 47, 65, 45 y 20. Con un nivel de significación del .05, ¿el jefe administrativo concluiría
con suficiente seguridad que tales peticiones siguen una distribución de Poisson donde   1?
12.16 En un experimento de diferencias por parejas se obtuvieron los datos mostrados en la siguiente tabla:
XA 3.4 4.1 3.9 3.5 3.8 4.3 4.3 2.9 4.0 3.5
XB 3.2 4.1 3.8 3.6 3.4 4.0 4.2 2.5 3.8 3.4
¿Es esta evidencia suficiente para indicar que P (XA  XB) es mayor o menor que 0.5?
a) Enuncie H0
b) Enuncie H1
c) Pruebe H0 para   0.05.
d) Encuentre el valor ℘ para la prueba.
12.17 En un periodo de seis meses, una institución financiera comparó los réditos mensuales porcentuales
para dos tipos diferentes de préstamos a corto plazo A y B. Los datos obtenidos se muestran en la tabla
siguiente:
Mes PA PB
1 11.4 13.3
2 10.5 9.9
3 10.1 10.5
4 7.2 9.0
5 11.1 12.2
6 6.8 8.2

¿Los datos proporcionan evidencia suficiente para establecer que las distribuciones de los réditos men-
suales para los dos tipos de préstamos difieren en localización? Use un nivel de significación del 10%.
12.18 Para conocer la opinión de los empleados de una empresa sobre dos planes de seguro médico, el depar-
tamento de recursos humanos seleccionó al azar a ocho empleados de la nómina. A cada uno de esos
empleados de la muestra se le explicó las características de ambos planes de seguro y se le solicitó que
calificará cada plan con una escala del 1 al 10, donde 1 indicaba que el plan era totalmente inaceptable
y el 10 que es totalmente aceptable. Las respuestas obtenidas aparecen en la siguiente tabla. ¿Indican
tales datos que las opiniones de los empleados sobre los planes de seguro difieren en forma sustantiva,
use un nivel de significación del 10%?
Plan de seguro
Empleado A B
1 8.0 8.0
2 8.5 7.5
3 8.5 6.0
4 7.0 9.0
5 9.0 7.0
6 7.5 4.0
7 9.5 8.0
8 8.0 5.0
12.19 Se realizó un estudio de mercado para comparar el precio de venta de dos tipos de pantalones. El pri-
mero es de material estándar, como la mezclilla, y el segundo es de material sintético, como el poliéster.
Se seleccionaron aleatoriamente diez piezas de cada tipo de pantalón, las cuales tuvieron los precios en
dólares que se muestran en la siguiente tabla:
Mezclilla Poliéster
A B
12.1 15.3
14.0 14.9
14.3 14.4
12.9 13.1
13.5 13.7
14.2 16.7
15.1 15.2
14.8 15.0
13.9 12.9
11.7 13.7

Pruebe la hipótesis nula “no hay diferencia entre las distribuciones de los precios para los dos tipos de
pantalón” contra la hipótesis alternativa de que el pantalón de poliéster tiende a ser más caro. Utilice un
nivel de significación cercano al 5%.
12.20 Un servicio de consultoría empresarial calcula que por cada delegación que atiende, durante cuatro turnos
de seis horas, hay 35% de probabilidad de recibir una llamada de asistencia. La información que se indica
en la tabla siguiente es de una muestra seleccionada aleatoriamente por 90 días.
Número de turnos durante los cuales

0 1 2 3 4
se recibieron llamadas
Número de días 8 32 30 12 8
A un nivel de significación del 5%, ¿siguen estas llamadas de asistencia una distribución binomial?
12.21 Se realizó un experimento de diferencias por parejas con n  35 pares. El número de veces que XA exceda
a XB era de 18. ¿Proporcionan los datos suficiente evidencia estadística para establecer una prueba de un
extremo derecho? Use   0.05
12.22 El jefe del área de personal de una empresa comercial comparó el número de accidentes por mes para dos
productos diferentes en su manejo de traslado, durante un periodo de doce meses. Los datos obtenidos
se enuncian en la tabla siguiente:
Mes
Producto E F M A M J J A S O N D
A 2 1 0 2 2 3 1 2 0 1 3 2
B 0 2 1 1 0 2 1 0 0 1 0 2
¿Proporciona la información evidencia para indicar diferencias en las tasas mensuales de accidentes entre
el manejo de traslado de los dos productos? Use un nivel de significancia del 5%.
12.23 Una oficina municipal valúa propiedades y ha instalado un programa de cómputo para esta tarea. Desea
comparar la eficacia del programa con valuaciones generadas por sus empleados dedicados a la valuación
manual de propiedades. El cociente asignación–venta es la medida usada para obtener con exactitud
las asignaciones de todas las oficinas valuadoras. Se seleccionaran 10 propiedades del municipio que
recientemente fueron vendidas. Para cada propiedad se calcularon dos cocientes, uno basado en la asig-
nación proporcionada por el programa de cómputo y el otro basado en la asignación proporcionada por
un valuador de la oficina. Los datos recopilados aparecen en la tabla siguiente:

Método de Asignación
Propiedad Programa Valuador
1 1.10 0.99
2 0.92 0.82
3 0.96 0.92
4 0.98 0.92
5 1.05 0.98
6 0.90 0.95
7 1.10 0.97
8 1.05 0.95
9 0.95 0.97
10 1.01 0.93
¿Indican los datos que los cocientes asignación–venta promedio son diferentes cuando se usa el progra-
ma de cómputo que cuando se usa un valuador para asignar valores a las propiedades en el municipio?
Use   .10
12.24 Una compañía que vende accesorios para cocinas realizó la misma campaña publicitaria para el producto
en grandes almacenes en dos localidades diferentes, A y B. Se eligieron aleatoriamente en cada localidad
a diez personas que asistieron a la campaña de publicidad, a quienes se les pidió que calificaran la cam-
paña en una escala del 1 al 20 que, respectivamente corresponden de una baja a una alta calificación. En
seguida se muestran las veinte calificaciones en una tabla:
Localidad A 18 15 13 11 17 20 5 14 9 12
Localidad B 10 6 15 8 6 10 16 7 17 8
¿Con los datos hay evidencia suficiente para establecer una diferencia en los niveles de calificaciones
entre las dos localidades? Utilice un  ercano al 5%.
12.25 El encargado de un módulo de operación de servicios de una dependencia gubernamental debe manejar
las horas pico, es decir, en las que llegan muchos clientes al mismo tiempo. Se selecciona aleatoriamente
un módulo de esta dependencia que está en un centro comercial para recolectar los datos que se presentan
en la siguiente tabla, de llegadas por minuto en un horario gubernamental de las 8 a las 14 y de las 16 a
las 18 horas cualquier día hábil de la semana.
Número de llegadas 1 2 3 4 5 6 7 8 9 10 11
Frecuencia 5 3 2 4 8 2 6 9 5 4 2
Pruebe si una distribución de Poisson, con una media de seis, describe adecuadamente la información.
Use un nivel de significación de .05

12.26 Dos especialistas en economía calificaron 20 proyectos presentados para un concurso bajo una convoca-
toria, en una escala del 1 al 10, en correspondencia de un valor menor a mayor. Los datos obtenidos se
presentan en la tabla siguiente:
Especialista Especialista
Proyecto A B Proyecto A B
1 6 8 11 5 5
2 4 5 12 4 3
3 7 4 13 4 6
4 8 7 14 9 8
5 4 3 15 9 10
6 2 5 16 6 9
7 7 8 17 8 5
8 9 9 18 4 2
9 7 4 19 3 3
10 2 3 20 8 8
¿Proporcionan los datos evidencia para indicar que uno de los especialistas tiende a otorgar calificaciones
más altas que el otro? Pruebe con un nivel de significación cercano al 5%.
12.27 En la siguiente tabla se dan los embarques para el año en curso y del año próximo pasado para seis ex-
portadores diferentes, en miles de cajas.
Año
Exportador En curso Pasado
1 4.81 4.27
2 5.03 5.97
3 2.38 2.61
4 4.26 3.96
5 5.14 4.86
6 3.93 3.17
¿Proporciona la información evidencia para establecer un nivel más elevado de exportaciones para este
año en comparación con el año pasado? Realice la prueba respectiva con   0.05
12.28 En una institución educativa se aplicaron en un curso de matemáticas dos métodos de enseñanza a dos
muestras de 9 y 10 estudiantes seleccionados aleatoriamente. Al término del curso ambos grupos pre-
sentaron un mismo examen. Las calificaciones del examen en una base de 100 puntos se presentan en la
siguiente tabla:

Método
A B
95 57
73 71
90 79
67 47
62 86
72 68
75 65
46 87
83 92
77
¿Indican los datos que hay diferencia entre los promedios de las calificaciones finales para los estudiantes
que aprendieron por los métodos A y B? Use   .05
12.29 Una empresa de venta de bienes raíces comparó la satisfacción de los clientes respecto de las ventas re-
cientes para dos vendedores. Durante el último mes, la empresa entrevistó a los comparadores de bienes
raíces de cada venta realizada por los dos vendedores, ocho para el vendedor A y siete para el vendedor
B. Se les solicitó que dieran el grado de satisfacción, al tratar con el vendedor, en una escala de 1 al 20,
consideradas respectivamente de menor a mayor. Las calificaciones se presentan en la tabla siguiente:
Vendedor A 15 13 14 18 20 17 16 20
Vendedor B 11 16 17 10 19 12 15
¿Proporcionan los datos suficiente evidencia para indicar una diferencia entre las calificaciones del nivel
de satisfacción de un vendedor a otro? Realice la prueba correspondiente a un  de 0.05
12.30 Una dependencia de gobierno realizó un estudio en 250 familias sobre su ingreso anual, en las principales
ciudades del país. Los datos recopilados se muestran en la siguiente tabla:
Ingreso anual Familias

Inferiores a 40 100 4
40 100 – 58 700 53
58 700 – 77 300 145
77 300 – 95 900 41
Superiores a 95 900 7

Se determino, por datos históricos, que el ingreso promedio anual real es de 68 000 pesos con una desviación
estándar poblacional de 12 400 pesos. La dependencia afirma que el ingreso promedio anual lo describe
una distribución normal. A un nivel de significación del 15%, sería aceptada la aseveración de que la
distribución del ingreso anual sigue un comportamiento de una distribución normal.
Respuestas de los ejercicios
12.1 n  14 ⇒ binomial;   5%; x  número de signos negativos; prueba de extremo derecho; P(X  10) 
.0899; H0 se acepta. No se ha producido un cambio significativo en el tiempo de cobro.
12.2 Prueba de dos extremos; n  35; RW  446; RW  315; RW  61.05;  5% ⇒ Zc   1.96; Aceptar H0
si 1.96  Zp  1.96; Zp  2.15 ⇒ H0 se rechaza luego H1 se acepta. El índice promedio de calificaciones
de los estudiantes de contabilidad ha cambiado en los últimos 10 años
12.3 Prueba de dos extremos; n1  35; n2  59 muestras de tamaño grande; n  94;Sn1  1691.5; Sn2  2773.5;
  1% ⇒ Zc   2.58; Aceptar H0 si 2.58  Zp  2.58; Zp  .23 ⇒ H0 se acepta. No hay diferencias
significativas entre los índices de calificaciones de los estudiantes de contabilidad y los de otras materias.
12.4 Prueba de dos extremos; n1  n2  10 muestras de tamaño grande; R1  Sn1  113.5; U1  41.5; U1  50;
U1  13.229;   10% ⇒ ZC   1.645; Aceptar H0 si 1.645  Zp  1.645; Zp  .643 ⇒ H0 se acepta.
La media de las edades no es significativamente distinta.
1.36
12.5 n  250 y  2 .05 α = .05 DC = ≅ .0860 por tablas; Rechazar H0 si Dks  .0860; como Dks  .1436,
250
entonces H0 se rechaza; por consiguiente, H1 se acepta. La distribución propuesta tiene pocas posibilidades
de ajustarse al comportamiento de la información.
12.6 n  10 ⇒ binomial;   3%; x  número de signos positivos; Prueba de extremo derecho; P(X  6) 
.3770; H0 se acepta. El tamaño ideal de la familia, según la opinión de las madres, no es significativamente
mayor que el que proponen las hijas.
12.7 Prueba de extremo izquierdo; n  14 y   5% por tablas de Wilcoxon WC  26; Rechazar H0 si Wp  WC;
Wp  W  16; como 16  26 ⇒ H0 se rechaza, luego H1 se acepta. Hay evidencia de que la media es
menor que 30.
12.8 Prueba de extremo izquierdo; n1  9; n2  10 muestras de tamaño pequeño; n  19;Sn1  62; Sn2  128;
  5% por tablas de suma de rangos de Wilcoxon ⇒ SC  69; Rechazar H0 si Sn1  SC; 62  69 ⇒ H0;
luego, H1 se acepta. Hay evidencias de que MM  MH
12.9 Prueba de extremo derecho; n1 13; n2  12 muestras de tamaño grande; R1  Sn1  164; U1  83;
  5% ⇒ ZC  1.645; U1 78; U1  18.385; con datos originales; US  108.24; rechazar H0 si U1  108.24
⇒ H0 se acepta. La promoción no ha hecho que las ventas aumenten en forma significativa.
1.22
12.10 n  125 y α = .10 DC = ≅ .1091 por tablas; Aceptar H0 si Dks  .1091; como Dks  .064, entonces H0
125
se acepta. Los datos están bien descritos por una distribución normal.
12.11 Sí, n  10 ⇒ binomial;   10%; x  el número de meses para los cuales la cantidad de demandas
en la sucursal A excede la cantidad de demandas en la sucursal B; Prueba de extremo izquierdo;
P(X  1)  .0108; H0 se rechaza. Hay evidencia suficiente para indicar que las distribuciones poblacionales
difieren en sus localizaciones relativas. Más bien, las datos sugieren que el número de demandas de cual-
quier mes en la sucursal A tiende a ser menor que el número de demandas correspondientes a la sucursal B.

Respuestas de los ejercicios 581
12.12 Prueba de dos extremos; n  19 y   5% por tablas de Wilcoxon WC  46; Rechazar H0 si Wp  Wc;
Wp  W  34; como 34  46 ⇒ H0 se rechaza, luego H1 se acepta. Hay pruebas para creer que la empre-
sa exagera, por lo que la agencia de protección debería iniciar alguna medida correctiva en contra de la
comercializadora.
12.13 Prueba de extremo derecho; n1  n2  10; Sn1  87; Sn2  123;   5% por tablas de suma de rangos de
Wilcoxon ⇒ Scs  128; Rechazar H0 si Sn1  Scs; 87  128 ⇒ H0 se acepta. Se tiene evidencia significativo
de que los publicistas prefieren el medio televisivo de la cadena de TV sobre la televisión local.
12.14 Prueba de dos extremos;n1  11 y n2  13 muestras de tamaño grande; R1  Sn1  134.5 y R2  Sn2 
165.5; U1  74.5 y U2  68.5; U2  71.5; U1  17.26;   6% ⇒ ZC  1.88; con datos originales Ui 
39.05 y US  103.95; Aceptar H0 si 39.05  U1 o U2  103.95 ⇒ H0 se acepta. No hay diferencia signifi-
cativa entre las dos escuelas.
1.36 1.36
DC =
12.15 El valor crítico del extremo superior es de .0962, ya que n  200 y   .05 ⇒ DC = =≅ ..0962
0962 por tablas;
n 200
H0 se rechaza si DKS  .0962; como DKS  .3858, entonces H0 se rechaza; por consiguiente,H1 se acepta.
Los datos no están bien descritos por una distribución de Poisson con   1.
12.16 n  9 ⇒ binomial;   5%
a) H0:  .50.
b) H1:   .50.
c) H0 se rechaza ⇒ H1 se acepta con x  número de signos positivos, luego x  8; P(X  8)  .0196 y P(X
 1)  .0196,
d) ℘  .0392.
12.17 Prueba de dos extremos; n  6 y   10% por tablas de Wilcoxon WC  2; Rechazar H0 si Wp  WC; Wp 
W  2; como 2  2 ⇒ H0 se rechaza, luego H1 se acepta. Las dos distribuciones de frecuencias relativas
poblacionales de los réditos mensuales porcentuales difieren respecto de su ubicación.
12.18 Prueba de dos extremos; n1  n2  8 muestras de tamaño pequeño; sn1  85.5; Sn2  50.5;   10% por
tablas de suma de rangos de Wilcoxon ⇒ Scs  51; Scs  85; Sp  Sn1  85.5; Rechazar H0 si Sp  51 o Sp
85; 85.5  85 ⇒ H0 se rechaza, luego H1 se acepta. Hay evidencia no significativa para establecer que las
opiniones de los empleados sobre los planes de seguro difieren.
12.19 Prueba de extremo izquierdo; n1  n2  10 muestras de tamaño grande; R1  Sn1  85.5 y R2  Sn2 
124.5; U1  69.5 y U2  30.5;  5% ⇒ Zcs  1.645; U1 50; U2  13.23; Zp  1.47; Rechazar H0
si Zp  1.645 ⇒ H0 se acepta. No hay suficiente evidencia para indicar que el pantalón de poliéster es
más caro que el de mezclilla.
1.36
12.20 n  90 y   .05 ⇒ DC  ≅ .1434 por tablas; Aceptar H0 si DKS  .1434; como DKS  .1186, entonces
90
H0 se acepta. Los datos están bien descritos por una distribución binomial con n  4 y   .35
12.21 n  35 ⇒ binomial que se aproxima por la normal estándar;   5%; x  el número de veces que XA ex-
cede a XB, luego ZC  1.645 y x  18; prueba de extremo derecho H0:   .50 y H1:   .50; Zp  .1692;
H0 se acepta.
12.22 Prueba de dos extremos; n  8 y   5% por tablas de Wilcoxon WC  4; Aceptar H0 si Wp  WC; Wp 

W  5, como 5  4 ⇒ H0 se acepta. No hay diferencias.
12.23 Prueba de dos extremos; n1  n2  10 muestras de tamaño pequeño;Sn1  127.5; Sn2  82.5;  10% por
tablas de suma de rangos de Wilcoxon ⇒ SCS 82; SCS  128; Sp  Sn1  127.5; Aceptar H0 si 82  Sp 
128; ⇒ H0 se acepta. Hay evidencia estadística no significativa de que los cocientes asignación-venta

promedio son iguales cuando se usa el programa de cómputo y cuando se usa un valuador para signar
valores a las propiedades en el municipio.
12.24 Prueba de dos extremos; n1  n2  10 muestras de tamaño grande; R1  Sn1  125 y R2  Sn2  85; U1
30 y U2  70; U1  50; U1  13.23;   5% ⇒ ZC 5  1.96; con datos originales Ui  24.07 y US  75.93;
aceptar H0 si 24.07  U1 o U2  75.93 ⇒ H0 se acepta. No hay diferencia en los niveles de calificación entre
las dos localidades.
1.36
12.25 Valor crítico del extremo superior es de .1923, ya que n  50 y α = .05 DC =
= .1923 por tablas; H0
50
se acepta si DKS  .1923; como DKS ≅ .1440, entonces H0 se acepta. Los datos están bien descritos por una
distribución de Poisson con   6.
12.26 n  17 ⇒ binomial;   .05; x  el número de veces que EA excede a EB, luego x  8; prueba de extremo
derecho H0:  ≤ .50 y H1:  .50; P( X  8)  .6854; H0 se acepta.
12.27 Prueba de extremo derecho; n  6 y   .05 por tablas de Wilcoxon WC  2; H0 se acepta si Wp  WC;
Wp  W 7; como 7  2 ⇒ H0, se acepta.
12.28 Prueba de dos extremos; n1  9, n2  10 muestras de tamaño pequeño; Sn1  91; Sn2  99;  5% por
tablas de suma de rangos de Wilcoxon ⇒ Sci  62; Scs  109; Sp  Sn1  91; Aceptar H0 si 62  Sp  109;
⇒ H0 se acepta. No hay una diferencia significativa entre los promedios de las calificaciones finales de los
estudiantes sujetos a métodos de enseñanza diferentes. También es posible resolver por aproximación
de la distribución normal.
12.29 Prueba de dos extremos; n1  8, n2  7 muestras de tamaño pequeño; R1  Sn1  75.5 y R2  Sn2  44.5;
U1  16.5 y U2  39.5; por tablas T de suma de rangos de U Mann Withney y   10% Ti  47 y TS  81;
Aceptar H0 si 47  R1 o R2  81 ⇒ H0 se acepta. No hay diferencia entre las calificaciones del nivel de
satisfacción de un vendedor a otro.
1.14
12.30 n  250 y α = .15 DC = ≅ .0721 por tablas; Aceptar H0 si DKS  .0721; como DKS  .0346, entonces
250
H0 se acepta. Los ingresos anuales familiares se describen según una distribución normal con parentesis
media de $68 000 y desviación estándar de $12 400.
Páginas Web recomendadas
También es de considerar la consulta de este material, escrito y tratado por otros autores, al revisar
las siguientes direcciones electrónicas:
http://ecampus.fca.unam.mx/ebook/imprimibles/contaduria/estadistica_2/Unidad_5.pdf
http://ftp.utalca.cl/profesores/gicaza/Apuntes%20PDF/Apuntes%20Cap%2012%20Metodos%20
no%20parametricos.pdf
http://biblio3.url.edu.gt/Libros/2012/esta-AE/15.pdf
http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento/materiales/anali-
sis_datosyMultivariable/19nparam_SPSS.pdf
http://academic.uprm.edu/eacuna/miniman11sl.pdf

No Parametrica

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

No Parametrica

Cargado por

Copyright:

Formatos disponibles

CAPÍTULO

CUALITATIVA Prueba z de comparación de Test de Mc Nemar

CUALITATIVA t Student-Fisher t de Student-Fisher

NO PARAMÉTRICA Figura 12.1 Estadística no paramétrica Fuente:

12.1 Estadística no paramétrica. Objetivo:

Iniciaremos el contenido de este capítulo bajo una estrategia de

y Wilcoxon U de Mann Whitney

Figura 12.2 Mapa conceptual de estadística no paramétrica

Alfaomega Estadística en el área de las Ciencias Sociales y Administrativas – Aragón

12.1 Estadística no paramétrica

Estadística en el área de las Ciencias Sociales y Administrativas – Aragón Alfaomega

12.2.1 Características de las pruebas no paramétricas

Características de las pruebas paramétricas

• I mplican forzosamente la prueba de los parámetros hipotéticos. Como se ha planteado en capítulos

Alfaomega Estadística en el área de las Ciencias Sociales y Administrativas – Aragón

Características de las pruebas no paramétricas

• No se relacionan con los parámetros de una población.

Los métodos no paramétricos son libres de distribución, es decir, no requieren de consideración

Estadística en el área de las Ciencias Sociales y Administrativas – Aragón Alfaomega

Algunas desventajas del uso de pruebas no paramétricas se enlistan en seguida:

Alfaomega Estadística en el área de las Ciencias Sociales y Administrativas – Aragón

Algunos tipos de pruebas no paramétricas se enuncian en seguida:

1. La prueba del signo.

2. La prueba del rango con signo.

12.3 Prueba del signo

Estadística en el área de las Ciencias Sociales y Administrativas – Aragón Alfaomega

Alfaomega Estadística en el área de las Ciencias Sociales y Administrativas – Aragón

8 140 8 150 8 020 8 230 8 100 8 170 8 430 8 200

El número de signos positivos x será el estadístico de prueba, luego x  4

Siguiendo los pasos de toda prueba de hipótesis, se tiene el algoritmo siguiente:

H0 : µ = 8200 el precio promedio de la excursión en el mercado internacional es el promocionado.

Estadística en el área de las Ciencias Sociales y Administrativas – Aragón Alfaomega

Ahora, si observamos con cuidado las hipótesis siguientes:

Alfaomega Estadística en el área de las Ciencias Sociales y Administrativas – Aragón

Siguiendo los pasos de toda prueba de hipótesis, se tiene el algoritmo siguiente:

H0 : π = .50 no existe diferencia entre las preferencias de los dos productos.

Estadística en el área de las Ciencias Sociales y Administrativas – Aragón Alfaomega

Número de miembro Puntuación a grupos Puntuación a grupos

Alfaomega Estadística en el área de las Ciencias Sociales y Administrativas – Aragón

Puntuación a grupos numerosos Puntuación a grupos pequeños Signo de la puntuación

Tabla 12.4 Resumen de signos de las 40 evaluaciones

Figura 12.3 Regla de decisión gráfica en unidades estandarizadas

Aceptar H0 si − 1.96 ≤ Zp ≤ 1.96

Alfaomega Estadística en el área de las Ciencias Sociales y Administrativas – Aragón

El cálculo del valor de prueba por el modelo correspondiente es:

Ahora, como Zp  1.46 cae en el intervalo (1.96, 1.96) ⇒ H0 se acepta.

12.4 Prueba del rango con signo de Wilcoxon

Estadística en el área de las Ciencias Sociales y Administrativas – Aragón Alfaomega

Prueba de un extremo izquierdo Prueba de un extremo derecho Prueba de dos extremos

H0 mediana  Med H0: mediana  Med H0: mediana  Med

Alfaomega Estadística en el área de las Ciencias Sociales y Administrativas – Aragón

Tipo de prueba valor de

Estadística en el área de las Ciencias Sociales y Administrativas – Aragón Alfaomega

Número de Aumento de peso con las dos dietas

Aumento de peso con las dos dietas Rango con signo

Alfaomega Estadística en el área de las Ciencias Sociales y Administrativas – Aragón

Estadística en el área de las Ciencias Sociales y Administrativas – Aragón Alfaomega

Lo anterior se presentará en el siguiente ejemplo con la misma información:

Número de Aumento de peso con las dos dietas

Alfaomega Estadística en el área de las Ciencias Sociales y Administrativas – Aragón

Aumento de peso con las dos dietas Rango con signo

Unilateral Bilateral n5 n6 n7 n8 n9 n  10

Estadística en el área de las Ciencias Sociales y Administrativas – Aragón Alfaomega

12.5 Pruebas de suma de rangos

NO PARAMÉTRICA Figura 12.1 Estadística no paramétrica Fuente:

• I mplican forzosamente la prueba de los parámetros hipotéticos. Como se ha planteado en capítulos

• No se relacionan con los parámetros de una población.

1. La prueba del signo.

2. La prueba del rango con signo.

• Para evitar empates que la variable aleatoria de interés sea continua.

Tabla 12.9 Fragmento de la tabla para obtener valores críticos de la prueba de Wilcoxon

• Si n1 y n2 son extrictamente menores a 10, en lenguaje simbólico n1  10 y n2  10, es decir, se

Tabla 12.14 Ingresos promedio por hora de todos los 15 trabajadores

Tabla 12.20 F ragmento de la tabla para obtener valores críticos de la prueba

Figura 12.7 Regla de decisión gráfica en unidades de la tabla correspondiente