Está en la página 1de 38

METODOS NO PARAMETRICOS

Dr. José Lima Hercilla


Introducción
 Para realizar estas pruebas no necesita hacer ninguna
suposición acerca de la distribución de la población.
 En ocasiones, se usa el término pruebas libres de
distribución. Además no se requieren que las
respuestas estén clasificadas u ordenadas, así que
deben ser medidas con una escala ordinal, de intervalo
o de razón.
 Consideremos cinco pruebas sin distribución y
coeficiente de correlación de los rangos de Spearma.
 Estas son: de Signo, de la mediana, de los rangos con
signo de Wilcoxon, de la suma de los rangos de
Wilcoxon y el análisis de la varianza por rangs de
Kruskal-Wallis.
Prueba de los Signos
Esta prueba se basa en el signo de una
diferencia entre dos observaciones relacionadas.
Se designa con un signo mas (+) una diferencia
positiva, y con un menos (-), una negativa.
Prueba de los Signos
Ejm.
 Una Nutricionista quiere ver si disminuirá el nivel de
colesterol de una persona si la dieta se complementa
con cierto mineral. Ella selecciona una muestra de 20
obreros mayores de 40 años de edad y mide su nivel de
colesterol.
 Después que los 20 sujetos toman el mineral durante 6
semanas, vuelve a medir su nivel de colesterol; si
disminuyó, se registra un signo «+». Si aumentó, se
registra un signo «-». Si no hay cambio, se registra cero
(y esa persona sale del estudio).
 En el caso de una prueba de los signos no interesa la
magnitud de la diferencia, sino sólo la dirección de ella.
Prueba de los Signos
La prueba de signos tiene muchas aplicaciones dentro de
ellas:
Para experimentos de «antes/después».
 Ej. Suponga la evaluación de un programa nuevo de
afinación de automóviles.
 Se registra el número de millas recorridas por galón de
gasolina antes de la afinación y de nuevo después de
esta.
 Si la afinación no es eficaz, es decir no tuvo efecto en el
desempeño, casi la mitad de los automóviles probados
presentará una disminución de las millas por galón. Y la
otra mitad, un aumento.
 Se asigna «+» a un aumento y «-» a una disminución.
Prueba de los Signos
Un experimento sobre la preferencia de un producto
 Una empresa vende dos clases de café en un frasco de
4 onzas: descafeinado y normal.
 Su departamento de I.M. quiere determinar si los
bebedores de café prefieren descafeinado o normal, y
para saberlo les dan dos tazas de café sin ninguna
marca y a cada uno se le pregunta cuál prefiere.
 La preferencia por café descafeinado se codifica (+), y
la preferencia por el regular, (-).
 En cierto sentido, los datos están en un nivel ordinal
debido a que los bebedores de café le dan a su bebida
preferida un rango más alto, mientras que el otro tipo
de café queda en un rasgo mas bajo.
CASO
 El director de Sistemas de información de una
empresa recomendó implementar un programa
de capacitación para gerentes en la planta.
 El objetivo es aumentar los conocimientos de
computación en los departamentos de ventas,
contabilidad y producción.
 Se seleccionó de forma aleatoria una muestra de
15 gerentes de los tres departamentos.
 Un panel de expertos clasifico a cada uno de
acuerdo con sus conocimientos en computación.
 Se clasificaron como sobresalientes, excelentes,
buenos, regulares o deficientes.
CASO
Después el programa de capacitación de tres
meses, el mismo panel de expertos en
sistemas de información calificó a cada
gerente una vez mas.
Un signo (+) indica una mejora, y un signo (-),
que la competencia del gerente con las bases
de datos declinó después del programa de
capacitación.
CASO
Signo de la
Gerente Antes Despues
Diferencia
01 Buena Extraordinaria +
02 Regular Excelente +
03 Excelene Buena -
04 Deficiente Bena +
05 Excelente Excelente 0
06 Buena Extraordinaria +
07 Deficiente Regular +
08 Excelente Extraordinaria +
09 Buena Deficiente -
10 Deficiente Buena +
11 Buena Extraordinaria +
12 Regular Excelente +
13 Buena Regular -
14 Buena Extraordinaria +
15 Deficiente Buena +
CASO
Lo que interesa saber es si el programa de
capacitación en la planta aumentó la eficacia
de los gerentes en el uso de la base de datos
de la empresa. Es decir ¿los gerentes son más
competentes después del programa de
capacitación que antes?.
CASO: Solución
Aquí para resolver el siguiente caso se deberá
utilizar el procedimiento de prueba de
hipótesis de 5 Pasos:
Paso 1: Formulación de Hipótesis
No hay aumento del conocimiento en el
H0: π ≤ 0.50 uso de las bases de datos como resultado
del programa de capacitación en la planta

Existe un aumento del conocimiento en el


H1: π > 0.50 uso de las bases de datos de los gerentes
después del programa de capacitación.
CASO: Solución
El símbolo π es la proporción de la población
con la característica particular.
Si no se rechaza la hipótesis nula, se indica que
el programa de capacitación no produjo ningún
cambio en el nivel de competencia o que la
competencia en realidad disminuyó.
Si se rechaza la hipótesis nula, se indica que la
competencia de los gerentes aumentó como
resultado del programa de capacitación.
CASO: Solución
El Estadístico de prueba sigue la distribución de
probabilidad binomial. Es apropiado, debido a que
la prueba de los signos cumple con todas las
suposiciones binomiales y estas son:
1. Solo hay dos resultados (éxito o fracaso) Un
gerente aumento su conocimiento o no.
2. Por cada intento, se supone que la probabilidad
de éxito es 0.50. y es la misma en todos los
casos.
3. El número total de intentos es fijo (15 en exp.)
4. Cada intento es independiente (no se relaciona
uno con otro).
CASO: Solución
Paso 2: Seleccione un nivel de significancia
Para este caso elija un nivel de 0.10.
Paso 3: Decida sobre el estadístico de prueba
Es el número de signos más que resulten del
experimento.
Paso 4: Formule una regla de decisión
En el caso el participante 05 el nivel de
conocimiento no mostro aumento ni reducción.
Por lo tanto se le elimino del estudio debido a
que no se pudo incluir en ningún grupo. n=14
CASO: Solución
• El número de éxitos aparece en la columna 1
• En la columna 2 la probabilidad de éxito
• En la columna 3 las probabilidades acumuladas (sumar las probabilidades
de éxito de la columna 2 desde la parte inferior)
Probabilidad Probabilidad
Exitos
de Éxito Acumulada
0 0.000 1.000
1 0.001 0.999
2 0.006 0.998
3 0.022 0.992
4 0.061 0.970
5 0.122 0.909
6 0.183 0.787
7 0.209 0.604
8 0.183 0.395
9 0.122 0.212
10 0.061 0.090
11 0.022 0.029
12 0.006 0.007
13 0.001 0.001
14 0.000 0.000
CASO: Solución
Este caso es una prueba de una cola debido a que la
hipótesis alterna proporciona una dirección.
La desigualdad (>) apunta hacia la derecha; por lo
tanto la región de rechazo está en la cola superior o
derecha.
Si La desigualdad (<) apunta hacia la izquierda; por
lo tanto la región de rechazo está en la cola inferior
o izquierda. En este caso se suman las
probabilidades de la columna 2 hacia abajo para
obtener las probabilidades acumuladas en la
columna 3.
CASO: Solución
El nivel de significancia es 0.10. Para llegar a la regla de
decisión para este problema, se recurre a las
probabilidades acumuladas en la tabla.}Se lee de abajo
hacia arriba hasta llegar a la probabilidad acumulada mas
cercana, pero sin exceder el nivel de significancia.
Para nuestro caso el nivel de significancia es 10 por lo
tanto la probabilidad acumulada mas cercana es 0.090. El
número de exitos (signos mas) que corresponden a 0.090
en la columna 1 es 10.

Regla de Decisión:
Si el número de signos más en la muestra es 10 o
mayor, se rechaza la hipótesis nula y se acepta la
hipótesis alterna.
CASO: Solución
Distribución de probabilidad binomial para n=14 y
π=0.50
Probabilidad de Probabilidad
Exitos
Éxito Acumulada
(1)
(2) (3)
0 0.000 1.000
0.250
1 0.001 0.999
2 0.006 0.998
3 0.022 0.992 0.200
4 0.061 0.970
5 0.122 0.909
6 0.183 0.787 0.150
7 0.209 0.604
8 0.183 0.395
0.100
9 0.122 0.212
10 0.061 0.090
11 0.022 0.029 0.050
0.000+0.01+
12 0.006 0.007 0.006+0.022
Suma hacia
13 0.001 0.001
arriba
14 0.000 0.000 0.000
Cálculo de la probabilidad
P(x)=nCx * πx * (1-π)n-x
x n-x
n= 14 nCx * π * (1-π)
π= 0.5 14¡ /2¡*(14-2)¡
x= 2 87178291200 0.25 0.0002441406250
958003200

0.005554199
0.006

Aplicando la formula y reemplazando x. darán


los resultado que están en la columna nro.
CASO: Solución
Distribución de probabilidad binomial para n=14 y
π=0.50
Probabilidad de éxito
CASO:Solución
Procedimiento para dos colas
 Se combinan las probabilidades de éxito en las
dos colas hasta estar lo mas ceca posible del nivel
de significancia deseado (∞) sin sobrepasarlo.
 En el caso ∞=0.10
 La probabilidad de 3 o menos éxitos es 0.029. si
se suman las dos colas se obtiene 0.058. Esto es
lo mas cercano que se puede estar de 0.10 sin
sobrepasarnos.
CASO:Solución
Paso 5.: Tome una decisión respecto a la
hipótesis Nula
 11 de 14 gerentes con el curso aumentaron su
competencia para las bases de datos.
 El número 11 esta en la región de rechazo, que
inicia en 10 por lo tanto, se rechaza Ho.
 Conclusión; El curso de capacitación de tres
meses fue eficaz, incrementa la competencia
de los gerentes.
Uso de la aproximación normal a la
Binomial
Si el número de observaciones en la muestra es mayor
que 10, puede utilizar la distribución normal para
aproximar la binomial.
El Estadístico de la prueba Z es:
𝑋 ± .50 − 𝜇
Prueba de los Signos, n> 10 𝑍=
𝜎

Si el número de signos (+) o (-) es mayor que n/2, emplee


la siguiente fórmula como estadístico de prueba:

Prueba de los Signos, n> 𝑋 − .50 − 𝜇 𝑋 − .50 − .50𝑛


10, signos + mayores que 𝑍= 𝑍=
𝜎 50 𝑛
n/2.
Uso de la aproximación normal a la
Binomial
Si el número de los signos (+)mas o (-) menos es ,menor
que n/2 el estadístico de prueba z es: aproximar la
binomial.
El Estadístico de la prueba Z es:
Prueba de los Signos, n> 10, 𝑋 + .50 − 𝜇 𝑋 + .50 − 𝜇
signos (+) menores que n/2 𝑍 = 𝜎
𝑍=
𝜎

 En las fórmulas X es el número de signos más o menos.


 El valor + 0.50 es el factor de corrección de continuidad.
 En resumen , se aplica cuando una distribución continua
como la normal (que se está utilizando) sirve para aproximar
una distribución discreta (la binomial).
Caso:
El área de I.M. de mercado de bebidas de gaseosa. Tiene
la tarea de probar una nueva bebida. Se consideran dos
versiones: Un refresco más bien dulce y uno un tanto
amargo. La prueba de preferencia que se realizará
consiste en la muestra de 64 consumidores. Cada uno de
éstos degustará las dos bebidas de cola, la dulce(con la
etiqueta A) y la amarga (con etiqueta B), e indicarán su
preferencia.
Realice una prueba de hipótesis para determinar si hay
una diferencia entre las preferencias por el refresco dulce
o por el amargo. Utilice un nivel de significancia de 0.05.
CASO: Solución
Paso 1: Formular hipótesis nula y alterna
H0: π = 0.50 No hay preferencia

H1: π ≠ 0.50 Si hay preferencia

Paso 2: Seleccione un nivel de significancia.


Es de 0.05 y está indicado en el enunciado del problema
Paso 3: Seleccione el estadístico de prueba.
Es Z, dada la formula 𝑋 ± .50 − 𝜇
𝑍=
𝜎

Donde: 𝜇 = 0.50n y 𝜎 = 0.50 𝑛.


CASO: Solución
Paso 4: Formule la regla de decisión.
 Áreas debajo de curva normal, para una prueba de dos
colas y el nivel de significancia de 0.05.
 Los valores críticos son +1.96 y -1.96.
 En una prueba de dos colas se divide la probabilidad de
rechazo a la mitad y coloca una mitad en cada cola, es
decir:0.05/2= 0.025.
 Lo que sigue es 0.5000-0.0250=0.4750
 Al buscar 0.4750 en el cuerpo de la tabla y leer el valor
z en el margen izquierdo obtiene 1.96 el valor crítico.
 Por lo tanto no rechace H0 si el valor z calculado se
encuentra en -1.96 y +1.96 , de lo contrario rechace H0
y acepte H1.
CASO: Solución
Paso 5: Calcule z, compare el valor calculado con el
valor crítico y tome una decisión respecto de H0.
 A la preferencia por el refresco A se le asignó un
signo (+). Y a la preferencia por (B) un signo (-).
 De las 64 personas de la muestra 42 prefirieron el
sabor dulce, que es el refresco A. Por lo tanto hay
42 signos más.
 Como es 42 es mayor que n/2 = 64/2=32
CASO
42 − .50 − .50(64)
𝑍= 𝑍 = 2.38
50 64

El valor z calculado es 2.38 es mayor que el valor crítico de


1.96. En consecuencia se rechaza la hipótesis nula de que no
hay diferencia con un nivel de significancia de 0.05
Conclusión: los clientes desean el refresco de cola dulce al
otro.
El valor p es la probabilidad de encontrar un valor z mayor que
2.38 o menor que 2.38. La probabilidad de encontrar un valor
z mayor que 2.38 es 0.500-0.4913=0.0087. Así, el valor p de
dos colas es 0.0174 resultado de (2*0.0087)
Por lo tanto la posibilidad de obtener un estadístico de la
muestra tan extremo cuando la hipótesis nula es verdadera, y
es menor que 2%.
Prueba de Hipótesis acerca de una
Mediana
 La prueba de los signos es una de las pocas pruebas
con que se demuestra el valor de una mediana.
 La mediana es el valor sobre el cual están la mitad de
las observaciones y debajo del cual encontramos la
otra mitad.
 Ej. Para los honorarios por hora de $7,$9,$11,$18, la
mediana es $10. La mitad de los honorarios están
arriba de $10 por hora, y la otra mitad por debajo de
$10 por hora.
 Para la prueba de hipótesis, a un valor por arriba de la
mediana se le da un signo más, y a un valor debajo de
la mediana, un signo menos. Si un valor es el mismo
que la mediana, en el análisis posterior se lo elimina.
CASO
Un estudio realizado hace varios años por el
departamento de I.M. del consumidor determino que la
cantidad mediana semanal gastada e abarrotes por
matrimonios jóvenes era de u.m. 123. El director
ejecutivo quiere repetir el estudio para determinar si
dicha cantidad cambió.
La información de la nueva muestra del departamento
reveló que, en una muestra aleatoria de 102 matrimonios
jóvenes, 60 gastaron mas de u.m. 123. la semana pasada
en abarrotes, 40 gastaron menos y 2 exactamente
u.m.123. Con un nivel de significancia de 0.10 ¿Es
razonable concluir que la nueva mediana no es igual a
um. 123?
CASO: Solución
 Si la mediana de la población es um. 123, se
espera que casi la mitad de los matrimonios
muestreados haya gastado más de um. 123 la
ultima semana, y que casi toda la otra mitad haya
gastado menos de 123 um.
 Después de eliminar a las parejas que gastaron
exactamente 123 um. Se debe esperar que 50
estén arriba de la mediana y 50 por debajo de ella.
 Es posible atribuir esta diferencia a la casualidad, o
es la mediana algún valor distinto a 123 um.?
 La prueba estadística de la mediana ayuda a
responder dicha pregunta.
CASO: Solución
Paso 1: Formular hipótesis nula y alterna
H0: Mediana = 123.00 um.

H1: mediana ≠ 123.00 um.

Paso 2: Seleccione un nivel de significancia.


Es de 0.10 y está indicado en el enunciado del problema

Esta es una prueba de dos colas, no indica dirección. Por


ende no interesa si la mediana es menor o mayor que 123
um. Sólo que es diferente a 123 um. El estadístico de prueba
cumple con las suposiciones binomiales.
CASO: Solución
• El estadístico de prueba cumple con las suposiciones
binominales, es decir:
• Una observación es mayor o menor que la mediana
propuesta, por lo que solo hay dos resultados posibles.
• La probabilidad de un éxito permanece constante en
0.50. Es decir π=0.50.
• Los matrimonios seleccionados como parte de la
muestra representan intentos independientes
• El número de éxitos se cuenta en un número fijo de
intentos. En el caso se consideran 100 matrimonios y
se cuenta el número de los que gastan más de 123 um.
A la semana.
CASO: Solución
• El tamaño de la muestra es 100; y π es 0.50,
por lo que n(π)= 100 (0.50)= 50 y n(1- π)=
100(1-0.50)=50, que son mayores que 5, por
lo que se utiliza la distribución normal para
aproximar a la binomial.
• Es decir, en realidad se emplea la distribución
normal para aproximar a la binomial.
• En realidad se emplea la distribución normal
estándar como el estadístico de prueba.
CASO: Solución
El nivel de significancia es 0.10 por lo tanto ∝/2
=0.10/2 = 0.05 del área se encuentra en cada
cola de una distribución normal.
Consultando la tabla de valores, los valores
críticos son -1.65 y +1.65.
La regla de decisión es rechazar Ho si z es menor
que-1.65 ó 1.65.
CASO: Solución
60 − .50 − .50(100)
𝑍= 𝑍 = 1.90
50 100

Se rechaza la hipótesis nula debido a que el valor


calculado de 1.90 es mayor que el valor crítico de 1.65.
La evidencia de la muestra indica que la cantidad
mediana gastada por semana en abarrotes por parejas
jóvenes no es 123 um. El valor p es 0.0574, determinado
mediante Determinado mediante 2(0.500 - 0.4713)El
valor p es menor que el nivel de significancia de 0.10 para
esta prueba.
Prueba de Hipótesis acerca de una
Mediana
42 − .50 − .50(64)
𝑍= 𝑍 = 2.38
50 64

El valor z calculado es 2.38 es mayor que el valor crítico de 1.96. En


consecuencia se rechaza la hipótesis nula de que no hay diferencia con
un nivel de significancia de 0.05
Conclusión: los clientes desean el refresco de cola dulce al otro.
El valor p es la probabilidad de encontrar un valor z mayor que 2.38 o
menor que 2.38. La probabilidad de encontrar un valor z mayor que
2.38 es 0.500-0.4913=0.0087. Así, el valor p de dos colas es 0.0174
resultado de (2*0.0087)
Por lo tanto la posibilidad de obtener un estadístico de la muestra tan
extremo cuando la hipótesis nula es verdadera, y es menor que 2%.

También podría gustarte