Está en la página 1de 12

Estadística I

Cuadernillo N° 10

ESTADÍSTICA
NO
PARAMÉTRICA
ESTADÍSTICA NO PARAMÉTRICA

DEFINICIÓN
Parte de la estadística que se ocupa del desarrollo de procedimientos aproximados para
efectuar procesos de inferencia estadística, independientemente de la forma de la
distribución de donde se toman las muestras aleatorias.

Diferencias entre la Estadística Paramétrica y la Estadística no Paramétrica.

Estadística paramétrica Estadística No paramétrica


Comprende procedimientos de inferencia Comprende procedimientos de inferencia
desarrollados a partir de una distribución desarrollados independientemente de la
específica. forma de la distribución de donde se
toman las muestras.
Los métodos paramétricos comprenden Los métodos no paramétricos
procedimientos exactos desarrollados a comprenden procedimientos aproximados
partir de la distribución de un estadístico. cuya aplicación es independiente de la
forma de la distribución.
Los supuestos requeridos son más La potencia de prueba es menor que en
exigentes que los de la estadística NO la estadística paramétrica.
paramétrica.

-2- www.grupolamatriz.com
Estadística No Paramétrica

En este capítulo [Estadística No Paramétrica], desarrollaremos las siguientes pruebas


de hipótesis:

1. Prueba sobre las frecuencias de distribuciones con k categorías.


Se utiliza para verificar si las frecuencias observadas no difieren significativamente de
ciertas frecuencias teóricas.

2. Prueba de Homogeneidad de una variable.


Se utiliza para verificar si una característica es homogénea en dos o más
poblaciones.

3. Prueba de Independencia entre dos variables.


Se utiliza para verificar si dos variables observadas en la misma población, son
dependientes o independientes entre sí.

Extracto Tabla Chi-Cuadrado para probabilidad 0,95

GL 1 2 3 4 5 6 7 8 9 10
2
(0,90) 2,706 4,605 6,251 7,779 9,236 10,645 12,017 13,362 14,684 15,987

2
(0,95) 3,841 5,991 7,815 9,488 11,070 12,592 14,067 15,507 16,919 18,307

2
(0,975) 5,024 7,378 9,348 11,143 12,832 14,449 16,013 17,535 19,023 20,483

2
(0,98) 5,412 7,824 9,837 11,668 13,388 15,033 16,622 18,168 19,679 21,161

2
(0,99) 6,635 9,210 11,345 13,277 15,086 16,812 18,475 20,090 21,666 23,209

www.grupolamatriz.com -3-
Estadística No Paramétrica

1. PRUEBA SOBRE FRECUENCIAS DE K CATEGORÍAS


Se utiliza para verificar si las frecuencias observadas en K clases o categorías
mutuamente excluyentes no difieren de ciertas frecuencias teóricas o esperadas.
También se puede decir que nos permite verificar si las frecuencias poblacionales
guardan alguna relación conocida.

Procedimiento:
(1) Planteamiento de hipótesis:
Hp: Las "k" clases o categorías están en la relación a:b:c:d:…
Ha: Las "k" clases o categorías no están en la relación a:b:c:d:…
Nota: Esta prueba es unilateral hacia la derecha.

(2) Elección del nivel de significancia "". (Generalmente  = 0,05)

(3) Cálculo de las frecuencias esperadas: ei = n i

Siendo:
ei = frecuencia esperada de cada clase o categoría.
i = proporción hipotética de la clase o categoría (frecuencia relativa).
n = tamaño de muestra.
k k
Además: n =  i =  ei
i =1 i =1

Siendo: i = frecuencia observada de cada clase o categoría.

(4) Prueba estadística con  grados de libertad.

2
2
k ( − e )
Utilice:  = i i
, si  > 1 y n  50

i=1 e
i

2
k (  −e − 0,5)
Utilice: 2 =  i i
, si  = 1 y/o n < 50

i=1 e
i

Siendo:  = k – 1 donde k es el número de clases o categorías que quedan


luego de la reducción (si es que se reducen).

-4- www.grupolamatriz.com
Estadística No Paramétrica

Nota: Para que la distribución del estadístico sea más aproximada a una
distribución chi-cuadrado es conveniente que las frecuencias esperadas sean
mayores o iguales a 5. En caso que se tengan frecuencias esperadas menores a
5 se deben agrupar categorías hasta lograr que las frecuencias no sean
menores de 5.

(5) Punto crítico:  22 =  (1


2
− , ) Región de
Región de aceptación
rechazo

Criterios de decisión: 1-



2 2
Se acepta Hp si: 
cal

2
22 = (12 −,  )
2 2
Se rechaza Hp si: 
cal

2

(6) Cálculo del valor de la prueba:  2cal

(7) Decisión y conclusiones.

Ejemplo de aplicación #1:


Un establecimiento de comida rápida que brinda el servicio de delivery ha tomado
una muestra aleatoria de 50 días para evaluar el número de llamadas que recibe
diariamente. Los resultados obtenidos fueron:

N° de llamadas 0 1 2 3 4
N° de días 4 8 12 16 10

El gerente del establecimiento sospecha que la frecuencia del número de llamadas se


presenta de acuerdo a la siguiente proporción: 1:2:4:6:3. ¿Qué se puede concluir de
dicha sospecha?
(Use  = 0,05)

www.grupolamatriz.com -5-
Estadística No Paramétrica

2. PRUEBA DE HOMOGENEIDAD
Se aplica cuando se desea verificar si una característica observada tiene un
comportamiento semejante u homogéneo en dos o más poblaciones. Es decir, nos
permite verificar si una variable se distribuye de manera similar en dos o más
poblaciones.
Las pruebas de homogeneidad suponen 2 o más muestras independientes.
El muestreo estratificado nos ayuda a identificar las poblaciones correspondientes.
Procedimiento:
(1) Planteamiento de la hipótesis.
Hp: La característica A tiene un comportamiento homogéneo en las “c”
poblaciones. La variable observada se distribuye homogéneamente en las
poblaciones dadas.
Ha: La característica A tiene un comportamiento diferente en al menos una de
las “c” poblaciones. La variable observada no se distribuye
homogéneamente en las poblaciones dadas.
Nota: Esta prueba siempre es unilateral hacia la derecha.

(2) Elección del nivel significancia "". (Generalmente  = 0,05)

(3) Cálculo de las frecuencias esperadas (eij):


(total de la fija i) (total de la columna j)
e =
ij total de datos
r c r c
Siendo: n =   e =    = total de datos
ij ij
i=1 j =1 i =1 j =1

Nota: Los datos muestrales correspondientes a cada grupo poblacional, suelen


ordenarse en filas y columnas. Los datos marginales de la variable son
aleatorios, mientras que los totales de cada grupo poblacional, no son
aleatorios.
(4) Estadístico de prueba con  = (#filas - 1) (#columnas – 1) grados de libertad:

r c ( − e ) 2
2 ij ij
Utilice  =  , Si  > 1 y n  50

i=1 j =1 e
ij

r c (  −e − 0,5) 2
Utilice: 2
 = 
ij ij
, Si  = 1 y/o n < 50

i=1 j =1 e
ij

-6- www.grupolamatriz.com
Estadística No Paramétrica

(5) Punto crítico:  22 =  (1


2
− ,  )
Región de aceptación Región de
rechazo

Criterios de decisión.
1- 
2 2
Se acepta Hp si:  cal   2 


2 2 22 =  2(1−,  )
Se rechaza Hp si:  cal   2

(6) Cálculo del valor de la prueba:  2CAL

(7) Decisión y conclusiones.

Ejemplo de aplicación #2.1:


La empresa Pilsen ha llevado a cabo un estudio de la opinión del público de los
distritos de Los Olivos, San Miguel y Comas, acerca de la calidad de su producto.
Para la selección se consideró realizar un muestreo estratificado por distrito,
seleccionándose en total 500 personas. Además se consideró aplicar las siguientes
restricciones durante la selección de las personas a ser encuestadas: la proporción
de hombres y de mujeres deberían ser similares; y las cantidades de personas
jóvenes, adultos, y mayores debería estar en la relación 3:2:1. Para otros criterios se
efectuó una selección irrestricta.
Los datos recolectados por el departamento de marketing fueron tabulados en los
siguientes cuadros:

Opinión sobre la calidad de la cerveza Pilsen, según nivel socioeconómico, sexo y edad.
Nivel socioeconómico Sexo Grupos de edad
Opinión Total
Alto Medio Bajo Masc. Fem. Jóvenes Adultos Mayores
Buena 20 50 120 120 70 110 55 25 190
Regular 20 90 50 90 70 90 40 30 160
Mala 40 60 50 30 120 50 65 35 150
Total 80 200 220 240 260 250 160 90 500

www.grupolamatriz.com -7-
Estadística No Paramétrica

Opinión sobre la calidad de la cerveza Pilsen, por distritos.


Opinión Los Olivos San Miguel Comas Total
Buena 60 50 80 190
Regular 50 40 70 160
Mala 70 30 50 150
Total 180 120 200 500

a) Establezca la hipótesis que se pueda probar con el cuadro de opinión sobre la


calidad de la cerveza Pilsen, según los grupos de edades de las personas.
b) Realice la prueba de hipótesis correspondiente al cuadro de opinión sobre la
calidad de la cerveza, por distrito. Use:  = 0,05.

Ejemplo de aplicación #2.2:


En un estudio dirigido a evaluar los programas transmitidos por los canales de señal
abierta, se tomó muestras en tres regiones, obteniéndose los resultados siguientes:

Opinión sobre programas de TV Total


Región
Malos Regulares Buenos
A 40 45 15 100
B 45 90 15 150
C 90 35 25 150
Total 175 170 55 400

¿Se puede concluir que la opinión sobre los programas de TV es semejante en las
tres regiones? Use:  = 0,05.

-8- www.grupolamatriz.com
Estadística No Paramétrica

3. PRUEBA DE INDEPENDENCIA
Se usa para verificar si dos características utilizadas como criterios de clasificación para
generar una tabla de contingencia, son independientes entre sí, o si existe alguna relación
entre ellas.
Una tabla de contingencia es un cuadro de doble entrada en el cual los datos de una
muestra aleatoria son clasificados de acuerdo a dos características o variables.
Nota: En un cuadro de contingencia, los totales marginales de filas y columnas, son
aleatorios.

Procedimiento:
(1) Planteamiento de hipótesis.
Hp: Las variables observadas son independientes entre sí.
Ha: Las variables observadas son dependientes entre sí.
Nota: Esta prueba es unilateral hacia la derecha.

(2) Elección del nivel de significancia "". (Generalmente  = 0,05)

(3) Cálculo de las frecuencias esperadas (eij). VARIABLE 2

B1 B2 B3 ..... Total
(total fila i)(total columna j)
e =
ij (total de datos) A1 11 12 13 ....
1

Totales aleatorios
VARIABLE 1

A2 21 22 23 .... 2

Siendo: A3 31 32 .... 3


.
r c r c .
n =   e =    = total de datos
.....

.
ij ij .
i=1 j =1 i =1 j =1

Total 1 2 3 .... n

Totales aleatorios

(4) Estadístico de prueba con:  = (#filas – 1) (#columnas – 1) grados de libertad:

r c ( − e ) 2
2 ij ij
Utilice:  =  , Si > 1 y n  50

i=1 j =1 e
ij

r c (  −e − 0,5) 2
ij ij
Utilice: 2
 =  , Si  = 1 y/o n < 50

i=1 j =1 e
ij

www.grupolamatriz.com -9-
Estadística No Paramétrica

(5) Criterios de decisión:


Región de aceptación Región de
rechazo

2 2
Se acepta Hp si:  cal   2
1- 
2 2 
Se rechaza Hp si:  cal   2

22 = (1
2
−,  )

(6) Cálculo del valor de la prueba: 2


Cal

(7) Decisión y conclusiones.

COEFICIENTE DE CONTINGENCIA
Medida estadística que permite si existe o no asociación entre dos variables cualitativas.

 2 cal
CC = 2
 +n
cal

0 < CC < 1
menor asoc. mayor asoc.

0 1

DIFERENCIAS ENTRE LAS PRUEBAS DE INDEPENDENCIA Y DE


HOMOGENEIDAD
INDEPENDENCIA HOMOGENEIDAD
Utiliza dos variables. Utiliza una sola variable.
Uno de los totales es aleatorio el otro está
Totales de filas y columnas aleatorios.
restringido.
Dos variables de una población. Una variable en varias poblaciones.

-10- www.grupolamatriz.com
Estadística No Paramétrica

Ejemplo de aplicación #3:


En un estudio para analizar los gastos y preferencias de los habitantes de Lima en bebidas
gaseosas se ha tomado una muestra aleatoria sin reemplazo de tamaño 500. La muestra se
estratifico por distritos, mediante una asignación proporcional; y con la finalidad de lograr
una representatividad de la composición de la población se determinó que en la selección de
las personas a ser encuestadas se aplique el siguiente criterio: la selección debería alternar
hombres y mujeres; es decir se elige a un hombre y luego se elige a una mujer (y así
sucesivamente); además, las tres primeras personas elegidas deberían ser de edades
comprendidas entre 18 y 25 años; las siguientes dos personas elegidas deberían ser de
edades comprendidas entre los 26 y 50 años; y la siguiente persona a elegir deberían de ser
de más de 50 años. Algunos de los resultados obtenidos de la información recopilada fueron:
Preferencia sobre bebidas, según nivel socioeconómico, sexo y edad.

Nivel
Sexo Edad
Bebida Socioeconómico
Total
Preferida De 18 a De 26 a De 51
Alto Medio Bajo Masc. Fem.
25 Años 50 Años a más
Coca Cola 25 60 65 75 75 110 10 30 150
Inca Cola 15 70 115 85 115 80 100 20 200
Agua 30 60 10 50 50 20 50 30 100
Otros 10 10 30 30 20 30 10 10 50
Total 80 200 220 240 260 240 170 90 500

a) Presente la hipótesis que se puede probar con el cuadro de preferencias según edades
de las personas.
b) Realice la prueba de hipótesis correspondiente al cuadro de preferencias según sexo
de las personas. Use:  = 0,05.
c) Realice la prueba de hipótesis correspondiente al cuadro de preferencias según nivel
socioeconómico de las personas. Use:  = 0,05.

www.grupolamatriz.com -11-

También podría gustarte