Está en la página 1de 25

Prueba no Paramétricas

Profesor:
Ingeniero Roberto E Gómez Fernández
Especialista en Estadística Aplicada
Especialista en Administración Financiera
Prueba no paramétrica
• La mayor parte de los procedimientos de prueba de hipótesis que se presentan
en las unidades anteriores se basan en la suposición de que las muestras
aleatorias se seleccionan de poblaciones normales. Tradicionalmente, estos
procedimientos de prueba se denominan métodos paramétricos.

• Existen procedimientos de prueba alternativos, llamados no paramétricos ó


métodos de distribución libre, que a menudo no suponen conocimiento de
ninguna clase acerca de las distribuciones de las poblaciones fundamentales,
excepto que éstas son continuas.
¿Qué ocurre con las pruebas no paramétricas frente a
las que si lo son?

Las pruebas no paramétricas no necesitan suposiciones respecto a la composición de los datos


poblacionales. Las pruebas no paramétricas son de uso común:

1.- Cuando no se cumplen las suposiciones requeridas por otras técnicas usadas, por lo general
llamadas pruebas paramétricas.

2.- Cuando es necesario usar un tamaño de muestra pequeño y no es posible verificar que se
cumplan ciertas suposiciones clave.

3.- Cuando se necesita convertir datos cualitativos a información útil para la toma de decisiones.
Ventajas de la prueba no paramétrica

1.- Por lo general, son fáciles de usar y entender.

2.- Eliminan la necesidad de suposiciones restrictivas de las pruebas paramétricas.

3.- Se pueden usar con muestras pequeñas.

4.- Se pueden usar con datos cualitativos.


Desventajas de la prueba no paramétrica

1.- A veces, ignoran, desperdician o pierden información.

2.- No son tan eficientes como las paramétricas.

3.- Llevan a una mayor probabilidad de no rechazar una hipótesis nula falsa
Las pruebas no paramétricas son pruebas estadísticas que no hacen suposiciones
sobre la constitución de los datos de la población.
Algunas prueba no paramétricas:
➢Prueba de signo

➢Prueba U de Mann- Whithey para muestras aleatorias independientes

➢Prueba H de suma de rangos o prueba de Kruskal-Wallis para


comparar k muestras independientes
➢Pruebas de aleatoriedad

➢Medidas de asociación

➢Prueba de independencia. Tablas de contingencias


Prueba de independencia. Tablas de contingencias
1. Establecer las hipótesis nula y alternativa.

2. Se
selecciona una muestra aleatoria y se registra la frecuencia observada, fij , para
cada celda de la tabla de contingencia

3. Calcular la frecuencia esperada, eij , para cada celda.

(Row i Total)(Column j Total)


eij =
Sample Size
4. Estadístico de prueba.

( f ij − eij ) 2
 2
= 
i j eij
5. Region de rechazo.

Se rechaza H0 si p -valor < a or 2  a2

Donde a es el nivel de significancia, con n filas y m columnas con (n-1)*(m-1) grados


de libertad
Datos:

A B C
Alto O11 O12 O13
Medio O21 O22 O23
Bajo O31 O32 O33
Datos:

Posición A B C Total
Alto O11 O12 O13 O.1
Medio O21 O22 O23 O.2
Bajo O31 O32 O33 O.3
Total O1. O2. O3. N

¿Cómo calcular el valor esperado o frecuencia esperada ?


Calculo del valor esperado o frecuencia esperada

Posición A B C Total
Alto O.1
Medio O.2
Bajo O.3
Total O1. O2. O3. N
Ejemplo 1:
Cada casa que se ​venden pueden ser clasificados de acuerdo a precio y estilo. El
gerente de una empresa de finca raíz le gustaría determinar si el precio de la casa
y el estilo son variables independientes.

El número de viviendas vendidas por cada modelo y el precio de los dos últimos
años se muestra a continuación. Por conveniencia, el precio de la casa está en la
lista, ya sea $ 99.000 o menos, o más de $ 99.000

Price Colonial Log Split-Level A-Frame


< $99,000 18 6 19 12

> $99,000 12 14 16 3
Hipótesis
H0: Precio de la casa es independiente del estilo de la casa que se
compra

Ha: Precio de la casa no es independiente del estilo de la casa que se


compra

Frecuencias observadas (fij)

Price Colonial Log Split-Level A-Frame Total


< $99K 18 6 19 12 55
> $99K 12 14 16 3 45
Total 30 20 35 15 100
Frecuencias esperada (eij)

Price Colonial Log Split-Level A-Frame Total


< $99K 16.5 11 19.25 8.25 55
> $99K 13.5 9 15.75 6.75 45
Total 30.0 20 35.00 15.00 100

(30)(55)
e11 = = 16.5
100
Con a = 0.05 y (2 - 1)(4 - 1) = 3 g.l.

Se rechaza H0 si p-valor <0.05 ó 2 >7.815

Estadístico de prueba

(18 − 16. 5) ( 6 − 11) 2


( 3 − 6. 75) 2 2
 =
2
+ + ... +
16. 5 11 6. 75
= 0.1364 + 2.2727 + . . . + 2.0833 = 9.149
Conclusion :
- Usando el p-Valor
P(2 ≥9.145)= 0,02737406 el área de la cola superior de la distribución
chi- cuadrado es menor que 0,05, se rechaza la hipótesis nula.

Usando el valor crítico:

2 = 9.149 > 7.815

Rechazamos, en el nivel 0.05 de significancia, la suposición de que


el precio de la casa es independiente del estilo de la casa que se
compra.
CONCLUSIÓN

• Después de conocer para qué nos pueden servir las pruebas estadísticas no paramétricas y los
supuestos que tienen, así como algunas pruebas paramétricas y los supuestos que se deben
cumplir en ellas, se puede apreciar que si no se tiene información acerca del cumplimiento de
ellos o si no se hacen las pruebas estadísticas pertinentes para ello, sería preferible recurrir a
las no paramétricas, también llamadas de distribución libre, pues en ninguna de ellas se
contempla el supuesto de que la distribución de la población tenga determinadas
características.

• Tal vez el problema al que se enfrenten algunos los estudiantes o investigadores, sea el
desconocimiento acerca de la estadística no paramétrica o la poca importancia que se le da al
cumplimiento de los supuestos en los que se basan las pruebas paramétricas.
Ejercicio 2:

La empresa Limpia Ya S.A. comercializa tres tipos de detergentes A, B y C. En un


análisis de segmentación de mercado para los tres productos, el grupo de
investigación encargado ha planteado la duda de si las preferencias para los tres
detergentes son diferentes entre los consumidores de los sectores Alto, Medio y
Bajo. Si la preferencia de los detergentes fuera independiente del sector
consumidor, se iniciaría una única campaña de publicidad para los tres productos;
sin embargo, si la preferencia depende del sector de consumo, se ajustarán las
promociones para tener en cuenta los distintos mercados de venta.
Datos

Producto
Posición Detergente A Detergente B Detergente C
Alto 14 12 10
Medio 21 16 8
Bajo 15 12 12
Solución:
Hipótesis:
H0: La preferencia de detergente es independiente del sector de consumo
H1: La preferencia de detergente no es independiente del sector de consumo
2. Nivel de significación del 5%

Producto
Detergente A Detergente B Detergente C Total
Alto 14 12 10 36
Medio 21 16 8 45
Bajo 15 12 12 39
Total 50 40 30 120
Calculo del valor esperado o frecuencia esperada (I,J)

Producto
Detergente A Detergente B Detergente C Total
Alto 36
Medio 45
Bajo 39
Total 50 40 30 120
• Estadístico de prueba:

Usando el p-Valor

X2=0,067+……………+0,077+0,519=2,146

P(X2> 2,146)=0,70892668

Usando el valor crítico:

2
𝑋4,0.05 = 9,487729

También podría gustarte