Está en la página 1de 23

INFERENCIA ESTADISTICA

NO PARAMETRICA

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

PRUEBAS ESTADISTICAS

Las pruebas estadísticas pueden ser paramétricas y no


paramétricas.

Las pruebas paramétricas asumen los parámetros de la


distribución de la variable (media y varianza) y un tipo de
distribución normal.

Las pruebas no paramétricas no asumen acerca de los


parámetros de distribución ni se preocupa por el tipo de
distribución, sino trabajan con simple ordenación y recuento
(asignando rankings) a los valores de la variable sin importar la
distribución.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

1
PRUEBAS PARAMETRICAS, para usarlas deben cumplirse supuestos:

•Las variables tienen que ser cuantitativas y estar medidas en escalas de


intervalo o razón
•Los datos siguen una distribución normal
•Las varianzas son iguales
•Muestras grandes (n > 30)

PRUEBAS NO PARAMÉTRICAS, se usan con:

•Datos de distribución libre (no necesariamente normal).


•Trata datos cuantitativos, ordinales o nominales
•Con varianza grande, un grupo con varianza 0 y el otro no
•Son aplicables con muestras pequeñas.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

VENTAJAS DE LAS PRUEBAS NO PARAMETRICAS


Hay ciertas ventajas en su uso, tales como:

•Trabajar con magnitudes cualitativas, además de las cuantitativas;

•Estudiar casos donde no es posible precisar la naturaleza de la


distribución;

•Son fáciles de entender.

DESVENTAJAS DE LAS PRUEBAS NO PARAMETRICAS


Tiene algunas desventajas como:

•Cálculos usualmente más engorrosos;

•No extraen tanta información como los paramétricos si se aplican al


mismo caso.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

2
DOCIMAS PARA UNA
MUESTRA

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Aleatoriedad de una muestra:


Prueba de rachas

A veces al realizar un muestreo, puede llegar a influir el orden


temporal o espacial en que las muestras han sido elegidas, con lo
cual no estamos en las condiciones de un muestreo aleatorio.

La Prueba de rachas contrasta la aleatoriedad de una secuencia


de eventos a partir del número de rachas “r” de la misma.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

3
Consideremos una muestra de tamaño n que ha sido dividida
en dos categorías + y - con n1 y n2 observaciones
cada una.

Se denomina racha (r) a una sucesión de items, eventos o


símbolos idénticos que pueden estar separados por otros
símbolos.

Por ejemplo si estudiamos una población de personas


podemos considerar como categoría el sexo :

- : Ser hombre (H)


+ : Ser mujer (M)

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Se observa los siguientes eventos:

HHH MM H MMM

4 rachas n1=4

HHH MM H MMM n2=5


- - -++ - +++ n= n1 + n2=9

En función de las cantidades n1 y n2 se espera que el


número de rachas no sea ni muy pequeño ni muy grande.

Una muestra con un número excesivamente grande o


excesivamente pequeño de rachas sugiere que la muestra
no es aleatoria.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

4
Si las observaciones son cantidades numéricas estas pueden
ser divididas en dos categorías o pueden ser clasificados en una
sucesión dicotomica según que cada observación este por
encima o por debajo de algún número fijado; a menudo este
número fijado es la mediana muestral obtenida.

En este caso, las observaciones que igualen al número fijado se


ignoran en el análisis y n1, n2 y n se reducen adecuadamente.

Por ejemplo si consideramos la mediana como el número fijado,


tendremos las siguientes categorías:

+ : Observación es superior a la mediana.


- : Observación es inferior a la mediana.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Pasos para el uso de la prueba de rachas de una muestra:

1) Se plantea la hipótesis H0 y H1.

Bilateral:

H0: Estipula que el patrón de ocurrencia de los 2 tipos de


observaciones es determinado por un proceso
aleatorio.

H1: El patrón de ocurrencia no es aleatorio.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

5
Unilateral (menores):

H0:Estipula que el patrón de ocurrencia de los 2 tipos de


observaciones es determinado por un proceso aleatorio.

H1: El patrón de ocurrencia no es aleatorio (debido a la presencia


de pocas rachas).

Unilateral (mayores):

H0:Estipula que el patrón de ocurrencia de los 2 tipos de


observaciones es determinado por un proceso aleatorio.

H1: El patrón de ocurrencia no es aleatorio (debido a la presencia


de muchas rachas).

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

2) Se clasifican las observaciones muestrales, en el orden que


ocurrieron, como una sucesión dicotomica, determinándose n1
y n2.

3) Conteo del número de rachas “ro”, donde ro: Nº de rachas


observadas en el proceso.

4)Establecer el nivel de significación “α” para el análisis.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

6
5)Se establecen los valores críticos, dependiendo del tamaño de
los grupos n1 y n2 :

a) Si n1 <20 y n2 son <20, respectivamente :

-Para una prueba de 2 colas y rechazamos Ho si:

ro≤ rmínimo=rn1,n2;(α/2) ó

ro ≥rmáximo = rn1,n2;(1-α/2)

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

-Para una prueba de 1 cola (menores, izquierda), se rechaza H0


cuando:

ro≤ rmínimo=rn1,n2;(α)

- Para una prueba de 1 cola (mayores, derecha), se rechaza H0


cuando:

ro≥ rmáximo=rn1,n2;(1-α)

rmínimo y rmáximo se obtienen de tablas (A.21-24).

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

7
b) Si n1 y n2 son ≥ 20, las tablas A.21-24 no pueden usarse.

Para muestras tan grandes, una buena aproximación a la


distribución muestral de “ro” es la distribución normal

con :
ro  N (  ro ,  r2o ) ; y

2n1n2
Media   ro  1
n1  n2

2n1n2 (2n1n2  n1  n2 )
Varianza   r2o 
(n1  n2 ) 2 (n1  n2  1)

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Por lo tanto, cuando n1 o n2 es mayor que 20, H0 puede probarse


estandarizando ro obteniéndose zc (estadístico z calculado):

ro   r
zc  , donde zc ~ N (0,1)
r
se rechaza H0, si:

 Unilateral Derecha: Z c  Z tabla,( )

 Unilateral Izquierda: Z c  Z tabla,( )

 Bilateral: Z c  Z  o Zc  Z 
tabla, tabla,
2 2

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

8
Ejemplo: Los siguientes datos muestran la discrepancia de la
temperatura de área normal registrada en una ciudad.
Deseamos saber, si podemos concluir que el patrón de
discrepancias por encima y por debajo de lo normal, es el
resultado de un proceso aleatorio.

DIA 1 2 3 4 5 6 7 8 9 10 11
DISCREPANCIA
DE LO NORMAL 12 13 12 11 5 2 -1 2 -1 3 2

DIA 12 13 14 15 16 17 18 19 20 21 22 23 24
DISCREPANCIA
DE LO NORMAL -6 -7 -7 -12 -3 6 7 10 6 1 1 3 7

DIA 25 26 27 28 29 30
DISCREPANCIA
DE LO NORMAL -2 -6 -6 -5 -2 -1

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Planteamos las hipótesis:

H0:Las observaciones de discrepancia de la temperatura normal


es aleatorio.
H1:Las observaciones de discrepancia de la temperatura normal
no es aleatorio.

Determinaremos las rachas observadas en la muestra.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

9
DIA 1 2 3 4 5 6 7 8 9 10 11
DISCREPANCIA
DE LO NORMAL 12 13 12 11 5 2 -1 2 -1 3 2
1 2 3 4 5
DIA 12 13 14 15 16 17 18 19 20 21 22 23 24
DISCREPANCIA
DE LO NORMAL -6 -7 -7 -12 -3 6 7 10 6 1 1 3 7
6 7
DIA 25 26 27 28 29 30
DISCREPANCIA
DE LO NORMAL -2 -6 -6 -5 -2 -1
8

(+) n1= 17 y (-) n2=13

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

ro = 8

El nivel de significancia será α=0.05

(+) n1= 17 y (-) n2=13

Entonces usando la tabla A.24 (izquierda: α/2=0.025 y Derecha: 1-α/2=0.975):

rmín (α/2=0.025) = 10
rmáx (1-α/2=0.975) = 21

Como ro< rmín se rechaza H0 con α=0.05

Por lo tanto: con un nivel de significación del 5% podemos afirmar que


las observaciones de discrepancia de la temperatura normal no es
aleatoria o no proceden de un proceso aleatorio.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

10
Ejemplo 2: Se desea conocer si la colocación de hombres y
mujeres en la cola frente a la taquilla de un cine es ordenado o
azaroso. Los datos se obtuvieron simplemente anotando el sexo de
50 personas en el momento de acercarse a la taquilla.

Orden de Hombres (M) y Mujeres (F) formados frente a la taquilla.

M F M F M M M F F M F M F

M F M M M M F M F M F M M

F F F M F M F M F M M F

M M F M M M M F M F M M

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Se plantean las hipótesis:

H0: La serie de hombres y mujeres en la cola es al azar

H1 : La serie de hombres y mujeres en la cola no es al azar.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

11
Orden de Hombres (M) y Mujeres (F) formados frente a la taquilla.

M F M F M M M F F M F M F

M F M M M M F M F M F M M

F F F M F M F M F M M F

M M F M M M M F M F M M

ro = 35

(M) n1 = 30 y (F) n2 = 20

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

(M) n1 = 30 y (F) n2 = 20

Entonces se calcula el valor de zc :

2n1n2
ro  (  1)
n1  n2
zc 
2n1n2 ( 2n1n2  n1  n2 )
( n1  n2 ) 2 ( n1  n2  1)
2(30)( 20)
35  (  1)
zc  30  20
2(30)( 20)[ 2(30)( 20)  30  20]
(30  20) 2 (30  20  1)

zc  2.98
ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

12
zc  2.98

Usando la tabla Normal obtenemos el valor del

Ztabla, 0.025=1.96 (prueba de dos colas)

Zc=2.98 > Ztabla, 0.025=1.96

Entonces, se rechaza Ho.

Concluimos que con un nivel de significancia del 5% la fila de


hombres y mujeres frente al cine no es aleatorio.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

LA PRUEBA JI CUADRADO (  ) DE UNA MUESTRA


2

La prueba Ji(chi)-cuadrado se basa en el ajuste de los datos


muestrales observados a una forma de distribución
particular planteada como hipótesis.

Partimos de una muestra aleatoria de tamaño “n” extraída


desde una población con función de distribución
acumulativa Fx desconocida. Se quiere probar la hipótesis
nula:
H 0 : Fx ( x)  F0 ( x) para todo x

Donde F0(x) está completamente especificada, contra la


alternativa general.
H1 : Fx ( x)  F0 ( x) para a lg ún x

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

13
Para aplicar la prueba de Ji cuadrado en este tipo de situaciones, debemos
agrupar los datos de la muestra de acuerdo a un esquema para formar una
distribución de frecuencias.

En el caso de datos cualitativos o de conteo, donde la hipótesis nula sería


discreta obtendremos en forma muy natural las categorías en términos de la
clasificaciones verbales o numéricas que son relevantes.

Por ejemplo:

• Al tirar un Dado:
las categorías serán los números de cada una de las caras,

• En encuestas sobre preferencias de marca:


las categorías serían los nombres de las marcas.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Cuando las observaciones muestrales son cuantitativas, las categorías


serán las clases numéricas determinadas por el experimentador. Para
estos casos la distribución de frecuencias no es única y debido a las
clase establecidas necesariamente se pierde información.

Para el análisis a través de la Ji cuadrado es necesario categorizar las


observaciones muestrales.

Suponiendo que la distribución poblacional esta especificada por la


hipótesis nula, podemos calcular la probabilidad de que una
observación sea clasificada aleatoriamente en cada una de las
categorías o clase fijadas (pi).

En base a la probabilidad anterior calcularemos la frecuencia que se


espera para cada categoría si la hipótesis nula fuera cierta, de la forma
: pi x n.
Ei  npi Donde, n: es el tamaño de muestra

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

14
Si las observaciones o datos muestrales son compatibles con la
función F0(x) que se encuentra especificada, entonces se
observaría una estrecha coincidencia entre las frecuencias
esperadas y las observadas, siendo la única variación la producida
por la aleatoriedad de la muestra.

La prueba Ji cuadrado para bondad de ajuste provee una base


probabilística para efectuar la comparación y decir si la falta de
coincidencia es demasiado grande para ocurrir debido al azar.

Entonces:

Supongamos que “n” observaciones han sido agrupadas en “k”


categorías mutuamente excluyentes y denotemos por :

oi : frecuencia observada en la i-ésima categoría, i=1,2,..,k


ei: frecuencia esperada en la i-ésima categoría, i=1,2,..,k

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

La decisión respecto al ajuste con la prueba Ji cuadrado, esta


basada en las desviaciones oi- ei..

El criterio de la prueba para la toma de decisiones es la


establecida por Pearson, la estadística de pruebas será:
k
(oi  ei ) 2
 c2     gl
2
 k 1
i ei

Un valor grande de Xc2 reflejaría una incompatibilidad entre las


frecuencias esperadas y observadas, por lo que la hipótesis nula
bajo la cual se calcularon las frecuencias esperadas (ei) será
rechazada para Xc2 grande.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

15
Hipótesis a contrastar :

H0: -Los datos siguen la distribución propuesta.

-No existe diferencias entre las frecuencias esperadas y las


observadas, las diferencias se deben a la aleatoriedad de la
muestra.

H1: -Los datos no siguen dicha distribución.

-Existe diferencias entre las frecuencias esperadas y las


observadas.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Regla de decisión:

Conociendo los diferentes valores de ei y oi, se puede calcular


el valor de  c mediante la formula:
2

k
(oi  ei ) 2
 c2   con k-1 g.l.
i ei

La significación de este valor obtenido  c2 puede determinarse


recurriendo a la Tabla .

Si αt ≤ α , se rechaza H0.

Ó Si

 c2, glk 1,  t2,k 1gl., , se rechaza H0.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

16
Caso Frecuencias Esperadas pequeñas:

Cuando K=2 (g.l.=1), cada frecuencia esperada deberá ser por lo


menos de 5.

Cuando K>2 (g.l.>2), la prueba chicuadrado no debe usarse si mas


del 20% de las frecuencias esperadas son menores que 5 o cuando
cualquier frecuencia esperada es menor que 1.

Las frecuencias esperadas algunas veces pueden incrementarse


combinando categorías adyacentes, esto solamente si pueden hacerse
combinaciones que tengan sentido y si hay mas de dos categorías.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Aplicación de la prueba Chicuadrada:

Los aficionados a las carreras de caballo a menudo afirman que


una carrera alrededor de una pista da lugar a ventajas
significativas para los caballos que ocupan ciertas posiciones de
posta.

La posición de posta a cualquier caballo le es asignado en la


línea de arranque. En una carrera de 8 caballos, la posición 1
es la más cercana a la barandilla interior de la pista, la posición
8 queda en el lado exterior, es la más alejada de la barandilla.

Probar el efecto de la posición de posta analizando los


resultados de la carrera, de acuerdo a las posiciones dadas,
durante el primer mes de carreras en una pista circular.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

17
Triunfos logrados en una pista circular de carreras de caballos
desde 8 posiciones de posta

posición de posta
1 2 3 4 5 6 7 8 TOTAL
Triunfos
esperados 18 18 18 18 18 18 18 18
Nº de
29 19 18 25 17 10 15 11 144
triunfos

Planteando las hipótesis:

Ho: No hay diferencia entre las observaciones y el nº esperado de ganadores


que partieron de cada una de las posiciones de posta y las diferencias
se deben a la aleatoriedad de la muestra.

H1: Existen diferencias entre las observaciones y la frecuencia esperada,


las diferencias no se deben a la aleatoriedad.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Determinamos el nivel de significancía para el análisis en


este caso α=0.05.

Calculamos el estadístico de la prueba:

k
(oi  ei ) 2
 c2   con 7 g.l.
i ei
(29  18) 2 (19  18) 2 (18  18) 2 (25  18) 2
 c2     
18 18 18 18
(17  18) 2 (10  18) 2 (15  18) 2 (11  18) 2
  
18 18 18 18

 c2  16.3

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

18
De la tabla Chi-cuadrado :con 7 g.l. , y α=0.05

tenemos:
Para el caso del valor del estadístico tenemos:

 c2  16.3 t2,7 gl,0.05  14.07

por lo tanto se rechaza H0

Concluimos: que con un nivel de significación del 5%,


existen diferencias significativas entre las frecuencias
observadas y los esperados y que no se deben al azar.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Aplicación 2:

El Banco de Crédito del Perú, trata de seguir una política de


extender un 60% de sus créditos a empresas comerciales, un
10% a personas naturales y un 30% a prestatarios
extranjeros.

Para determinar si la política se estaba siguiendo, el


Vicepresidente Ejecutivo Comercial, selecciona
aleatoriamente 85 créditos que se aprobaron recientemente.
Encuentra que 62 de tales créditos se otorgaron a negocios,
10 a personas naturales y 13 a prestatarios extranjeros.

Con un nivel de significancia del 10%, contestar si el patrón


de cartera deseado se preserva.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

19
hipótesis:
Ho: Se mantuvo el patrón deseado: 60% créditos comerciales,
10% préstamos a personas naturales y 30% son créditos
extranjeros.

H1: El patrón deseado no se mantuvo.


Determinamos el nivel de significancía para el análisis en este
caso α=0.1.

Luego necesitamos conocer las frecuencias esperadas, entonces, de


cumplirse Ho tendremos:

Tipo de Frecuencias
Crédito
ni pi Esperadas (ei)

Comercial 0.6 85x0.6 = 51

Personal 0.1 85x0.1 = 8.5


Extrajero 0.3 85x0.3 = 25.5
TOTAL 85 1

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Resumiendo los datos del problema en una tabla de doble


entrada:

Tipo de Frecuencias Frecuencias


Crédito Observadas (oi) Esperadas (ei)

Comercial 62 51
Personal 10 8.5
Extrajero 13 25.5

Con los datos muestrales contenidos en la tabla calculamos


el estadístico de la prueba, K=3:

k
(oi  ei ) 2
 c2   con 2 g.l.
i ei

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

20
(62  51) 2 (10  8.5) 2 (13  25.5) 2
 2
c  
51 8.5 25.5

 c2  8.76

De la tabla chi-cuadrado con 2 g.l. y α=0.1

obtenemos el estadístico de tabla : t2   22gl ,0.1  4.60

Regla de decisión, como  c2   t2 Rechazamos Ho.

Concluimos:

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Concluimos:
Por lo tanto con un nivel de significancia del 10%
podemos afirmar que existen diferencias significativas
entre lo que el Vicepresidente observó y lo que esperaba
observar, entonces podemos concluir que no se mantuvo
el patrón de crédito deseado.

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

21
Aplicación 3:
El Jefe del Departamento de Control de Calidad ha informado a la
Gerencia de cierta Empresa, que el número de defectos en las
tarjetas de circuito impreso sigue una distribución Poisson con
parámetro  = 0.75.
A fin de corroborar dicha afirmación, solicita al área de estadística
realice el análisis correspondiente a fin de sustentar o refutar
técnicamente lo informado por el Departamento de Control de
Calidad. Para dicho fin, se reúne una muestra aleatoria de 60
tarjetas de circuito impreso y se observa el número de defectos.
Los resultados obtenidos son los siguientes:

Número de Frecuencia
defectos observada
0 32
1 15
2 9
3 ó más 4

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

Hipótesis:
Ho: La forma de la distribución de los defectos es Poisson
(=0.75).

H1: La forma de la distribución de los defectos no es Poisson

Determinamos el nivel de significancia para el análisis en este


caso α=0.05.

A partir de la distribución Poisson con parámetro =0.75,


pueden calcularse las probabilidades asociadas con el valor de
x, (x: N° de defectos)

Luego consideramos la Función de Probabilidad de la Poisson ():

e   x
f ( x) 
x!
ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

22
Bajo el supuesto de H0 verdadera calculamos las
probabilidades de ocurrencia en cada categoría:
Frecuencia
Número de
observada Pi(Xi=xi) Ei(x)=n*Pi
defectos
Oi
0 32 0.472 28.32
1 15 0.354 21.24
La celda
2 9 0.133 7.98 representa el
3 ó más 4 0.041 2.46 25% de las
celdas con
n= 60 esperado <5

Frecuencia
Número de
observada Pi(Xi=xi) Ei(x)=n*Pi (Oi-Ei)^2 (Oi-Ei)^2 / Ei
defectos
Oi
0 32 0.472 28.32 13.54 0.48
1 15 0.354 21.24 38.94 1.83
2 ó más 13 0.174 10.44 6.55 0.63
n= 60 Xc2= 2.94

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

 c2  2.94

De la tabla chi-cuadrado con 2 g.l. y α=0.05


obtenemos el estadístico de tabla : t2   22gl,0.05  3.84
Regla de decisión, como  c2   t2 No rechazamos Ho.

Concluimos: con un α= 0.05 podemos afirmar que la distribución


de defectos en las tarjetas de circuito impreso sigue una
distribución de Poisson (=0.75).

ESTADISTICA APLICADA II LIC. RITA GUZMAN LOPEZ

23

También podría gustarte