Está en la página 1de 10

PRUEBAS NO PARAMTRICAS

Distribucin chi-cuadrada (
2

La distribucin chi cuadrada es toda una familia de distribuciones. Existe una distribucin chi-cuadrada para cada grado de libertad. La Figura 1 muestra que a medida que se incrementan los grados de libertad la distribucin se vuelve menos sesgada. Las aplicaciones ms comunes de la distribucin chi-cuadrada son (1 pruebas de bondad de a!uste " (# pruebas de independencia. A! Pru"bas d" b#ndad d" a$ust" $edidas sobre que tan cerca se a!ustan los datos muestrales observados a una forma de distribucin particular planteada como hiptesis. %i el a!uste es ra&onablemente cercano' puede concluirse que si existe la forma de distribucin planteada como hiptesis. (rueba chi-cuadrada

(O =
k i =1

Ei ) Ei

(1.1

donde k) *+mero de categor,as o clases k-m-1) grados de libertad donde m es el n+mero de parmetros a estimar. %!Pru"ba &ara un a$ust" uni'#r("! -uan (.re&' director de $ercadeo de /lden de -ure&' tiene la responsabilidad de controlar el nivel de existencias para cuatro tipos de automvil vendidos por la firma. En el pasado' ha ordenado nuevos automviles ba!o la premisa de que los cuatro tipos son igualmente populares " la demanda de cada tipo es la misma. %in embargo' recientemente las existencias se han vuelto ms dif,ciles de controlar' " -uan considera que deber,a probar su hiptesis respecto a una demanda uniforme. %us hiptesis son) H0) La demanda es uniforme para los cuatro tipos de autos. H1) La demanda no es uniforme para los cuatro tipos de autos. La 0abla 1.1 muestra la expectativa uniforme para una muestra de 12 autos vendidos durante el +ltimo mes Tab)a %!% R"*istr# d" +"ntas d" A)d"n d" ,u-r". Ti&# d" aut# +"ntas #bs"r/adas 3a 14 Fiesta 11 Focus 15 6lio 1# +"ntas "s&"radas 1# 1# 1# 1#

= 1.17 12 12 12 12 7ebido a que no ha" parmetros que estimarse el n+mero de grados de libertad es 8-1 9 : grados de libertad. %i -uan deseara probar al nivel del 4;' se encontrar,a' como lo 2 muestra la Figura 1.#' que 0.05 , 3 = 7.815
2

( 15 12 ) =

( 11 12 ) +

( 10 12 ) +

( 12 12 ) +

R"*)a
" *o recha&ar si

d"
7.815. <echa&ar si

d"cisin0
> 7.815 "

6omo 1.1= > =.214' la hiptesis de que la demanda no es uniforme no se recha&a. B!Tab)as d" c#ntin*"ncia! Una &ru"ba d" ind"&"nd"ncia La distribucin chi-cuadrada tambi.n permite la comparacin de dos atributos para determinar si existe una relacin entre ellas. E!emplo. (at" /lvarado es la directora de investigacin de (laguicidas de -ure&. En su pro"ecto actual (at" debe determinar si existe alguna relacin entre la clasificacin de efectividad que los consumidores asignan a un nuevo insecticida " el sitio (urbano o rural en el cual se utili&a. 7e los 155 consumidores a quienes se le aplic la encuesta' =4 viv,an en &onas urbanas " #4 en &onas rurales. La 0abla 1.# resume las clasificaciones hechas por los consumidores. Tab)a %!2 Tab)a d" c#ntin*"ncia d" P)a*uicidas d" ,u-r". C)asi'icacin Urban# Rura) /rriba del promedio #5 11 #:.: =.=4 (romedio 15 2 :? 1# 7eba!o del promedio 14 ? 14.2 4.#4 0otal =4 #4 H0) La clasificacin " la ubicacin son independientes. H1) La clasificacin " la ubicacin no son independientes.

2 =

T#ta) :1 12 #1 155

( 20 23.3 ) 2
23.3

( 11 7.75 ) 2 ( 40 36 ) 2
7.75 + 36

( 8 12 ) 2
12

( 15 15.8 ) 2
15.8

( 6 5.25 ) 2
5.25

= 3.76

La prueba tiene (r 1 (c 1 9 (: -1 (# @ 1 9 # grados de libertad. %i (at" fi!a 9 15;' 2 0.10 , 2 = 4.605 ' la hiptesis nula no se recha&a. Pru"ba d") si*n# Ana prueba no param.trica utili&ada com+nmente para tomar decisiones en relacin a diferencias entre poblaciones como contraparte de la distribucin t' la cual requiere el

supuesto de normalidad de ambas poblaciones. La prueba de signos es +til cuando no se cumple este supuesto. %e supone que se tienen datos antes " despu.s para una muestra " se desean comparar estos con!untos de datos correspondientes. %e hace restando las observaciones por pares' " se anota el signo algebraico resultante. *o es importante la magnitud de la diferencia' sino solo si resulta un signo ms o un signo menos. La hiptesis nula establece que no existe diferencia en los con!untos de datos. %i esto es cierto' entonces un signo ms " un signo menos son igualmente probables. La probabilidad de que ocurra cualquiera es de 5.45. Ana prueba de dos extremos es) H0: m = p H1: m p en donde m " p son los n+meros de signos menos " de signos ms' respectivamente. Ana prueba de un solo extremo es) H0: m = p H1: m > p o H0: m = p H1: m < p E$"(&)#! An analista de mercado desea medir la efectividad de una campaBa promocional del producto de su empresa. /ntes de la campaBa' selecciona 1# tiendas minoristas " registra las ventas del mes. 7urante el segundo mes se termina la campaBa promocional " se registran de nuevo las ventas. La 0abla 1.: muestra los niveles de ventas' !unto con el signo algebraico que resulta cuando las ventas del segundo mes se restan de las del primer mes. Tab)a %!1 +"ntas &ara d#c" ti"ndas (in#ristas Ti"nda Ant"s D"s&u2s Si*n# 1 C1#55 C1555 D # C4=55 C?555 : C:255 C:255 5 1 C1E55 C1=55 D 4 C?:55 C?455 ? C:?55 C:E55 = C1255 C1E55 2 C4255 C4555 E C1=55 C1=55 5 15 C4155 C4#55 11 C2:55 C=#55 D 1# C#=55 C::55 %e desea probar la hiptesis de que la promocin increment las ventas con un nivel de significancia del 4;. Esta es una prueba de extremo derecho' como se muestra enseguida)

H0: m p H1: m > p (regunta) Fu. har,a que se recha&ara la hiptesis nulaG 1 un n+mero significativamente grande de signos menos # un n+mero significativamente pequeBo de signos ms *+mero de signos menos 9 ? *+mero de signos ms 9 1 Los valores que resultan en una diferencia de cero se eliminan. La 0abla de 7istribucin Hinomial establece que la probabilidad de seis o ms signos menos es)
p( m 6 | n = 10 , = 0.5 ) = 1 P ( X 5 ) = 1 0.6230 = 0.3770

Este valor de 5.:==5 es la probabilidad de obtener seis o ms signos menos ( o cuatro o menos signos ms si la probabilidad de ocurrencia de cualquier signo es de 9 5.4. %e nota que si el n+mero de signos menos fuera inusitadamente grande' se recha&ar,a la hiptesis nula. %in embargo' ? no es un n+mero grande. La probabilidad de su ocurrencia es ma"or que un de 5.4;' el evento de ? signos menos no se considera grande' " la hiptesis nula de que H0: m p no se recha&a' por lo tanto no se puede considerar que la promocin ha"a sido exitosa. +a)#r d" 3 &ara &ru"ba d") si*n# c#n (u"stras *rand"s (n 30
Z= k 0.5 0.5 n 0.5 n

4a &ru"ba d" rachas 6uando no existe aleatoriedad' muchas de las herramientas estad,sticas en las cuales se conf,a son de poco uso o de ning+n uso. (ara comprobar la aleatoriedad se utili&a una prueba e ra!"a#. Pru"ba d" rachas! (rueba no param.trica de aleatoriedad en el proceso de muestreo. Racha! Ana serie continua de uno o ms s,mbolos. E$"(&)#! %uponga que se seleccionan los empleados para un programa de entrenamiento. %i la seleccin no depende de si el empleado es de sexo masculino ( m o femenino (f ' se esperar,a que el g.nero fuera un evento aleatorio. %in embargo' si se detecta alg+n patrn en el g.nero' se puede asumir que la aleatoriedad est ausente " que la seleccin se hi&o' por lo menos en parte' con base en el g.nero de un traba!ador. %i existe un n+mero inusualmente grande o inusualmente pequeBo de rachas' se sugiere un patrn. /s,' por e!emplo IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII mmm ffffff mmm

_____________________________________________ 1 # : IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 0res rachas existen en esta muestra. 0res hombres ' seguidos de seis mu!eres " luego tres hombres. /parentemente existe ausencia de aleatoriedad. 6onsideremos ahora que el orden de seleccin es IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII m f m f m f m f m f m f m f m f _______________________________________ 1 # : 1 4 ? = 2 E 15 11 1# 1: 11 14 1? IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 7e nuevo' parece existir un patrn que produce un n+mero inusualmente grande de 1? rachas independientes. D"t"ccin d" un &atrn! %i se presentan mu" pocas o demasiadas rachas' puede estar ausente la aleatoriedad. An con!unto de hiptesis para probar es) H0) Existe aleatoriedad en la muestra. H1) *o existe aleatoriedad en la muestra. (ara probar la hiptesis se debe determinar si el n+mero de rachas r es demasiado grande o demasiado pequeBo. Las 0ablas de valores cr,ticos de r en la prueba de rachas muestran el n+mero de rachas si es 4;. %upongamos ahora que las selecciones fueron) IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII m fff mmm ff mmm 1 # : 1 4 IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII Las selecciones parecen ms aleatorias porque no existe patrn evidente. %e nota que n1 = 7 es el n+mero de hombres " n2 9 4 es el n+mero de mu!eres. La tabla $1 muestra el n+mero cr,tico m,nimo de rachas para un valor de de 4;.. %i el n+mero de rachas es igual o menor que el valor mostrado en la tabla $1' se sugiere que al nivel del 4; ha" mu" pocas rachas como para confirmar la hiptesis nula de aleatoriedad. 7ebido a que n1 9 = " n2 9 4' se halla el valor cr,ticamente ba!o que es :. 7ebido a que el n+mero de rachas excede este m,nimo' entonces no ha" un n+mero significativamente ba!o de rachas como para garanti&ar el recha&o de la hiptesis nula. La tabla $# proporciona valores cr,ticamente altos para r. si el n+mero de rachas en una muestra es igual o ma"or que estos valores' se puede concluir que existe un n+mero extremadamente grande de rachas' lo que sugiere la ausencia de aleatoriedad. (ara n1 9 = " n2 9 4' la tabla $# revela que el n+mero mximo de rachas es 11. %i el n+mero de rachas es superior a 11' existen demasiadas como para sustentar la hiptesis de aleatoriedad. 7ebido a que el n+mero de rachas es menor que 11' no es significativamente alto " no se recha&a la hiptesis nula al nivel del 4;. Us# d" )a ("diana c#(# ("dida &ara bi'urcar )#s dat#s

E$"(&)#! %e asumen niveles de produccin diarios en una mina de carbn seleccionada para un estudio estad,stico' " .stos son' :1' 4=' 4#' ##' #1' 4E' #4' #E' #=' 11' 1:' :#' 15' :=' " ?5 toneladas. La mediana de := puede utili&arse como valor de referencia. Las observaciones caen o por arriba (/ o por aba!o (H de :=' produciendo 2 rachas de) IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII :1 4= 4# ## #1 4E #4 #E #= 11 1: :# 15 ?5 IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII H / / H H / H H H / / H / / 1 # : 1 4 ? = 2 IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII 6on n1=7 para H " n2 9 = para /' la tabla $ revela valores cr,ticos de : " 1: rachas. 7ebido a que ha" 2 rachas' se asume que ha" aleatoriedad " no se recha&a la hiptesis nula. Pru"ba U d" Mann-5hitn"6 Es la contraparte no param.trica de la prueba t para muestras independientes. *o requiere del supuesto de que las diferencias entre las dos muestras est.n distribuidas normalmente. E$"(&)#! %uponga que una fbrica de cermicas desea comparar el tiempo que toma a las pie&as de barro enfriarse despu.s de haber JardidoK en el horno mediante dos m.todos diferentes. Los alfareros queman 1# pie&as utili&ando el m.todo 1' " 15 utili&ando el m.todo #. El n+mero de minutos necesarios para que cada pie&a se enfr,e es el siguiente) $.todo1 #= :1 #2 #E :E 15 :4 :: :# :? := 1: $.todo # :1 #1 :2 #2 :5 :1 := 1# 11 11 Tab)a %!7 <angos de tiempos de enfriamiento M2t#d# % Ran*# #= #2 #E :1 :# :: :4 :? := :E 15 # :.4 4 = 2 E :1 :1 1# 1: 11.4 1= 12 := :2 15.4 15.4 11.4 1? M2t#d# 2 #1 #2 :5 Ran*# 1 :.4 ?

11 1# 1: #1 11 <191:5

1E #5 ## <#91#:

%e calcula el estad,stico de $ann-Lhitne" para cada muestra de la ecuacin' as,)


n1 ( n1 + 1 ) %1 2 n (n + 1 $ 2 = n1n2 + 1 1 %2 2 12( 12 + 1 ) $ 1 = ( 12 )( 10 ) + 130 = 68 2 10( 10 + 1 ) $ 2 = ( 12 )( 10 ) + 123 = 52 2 %e nota que U1+ U2 = n1n2 proporciona un chequeo rpido de su aritm.tica. $edia " 7esviacin estndar de la distribucin muestral para la (rueba U de $annLhitne" n n ( 12 )( 10 ) u = 1 2 = = 60 2 2 $ 1 = n1n2 +

n1n2 ( n1 + n2 + 1 ) ( 12 )( 10 )( 12 + 10 + 1 ) = = 15.17 12 12 Malor de Z para normali&ar la prueba U de $ann-Lhitne" $ u Z= 1 u (rueba de dos extremos) (robar la hiptesis de que los tiempos promedio de enfriamiento de enfriamiento del m.todo 1 " del m.todo # son los mismos

u =

' 0 & 1 = 2 ' 1 & 1 2

Atili&ando arbitrariamente U2' se tiene que


Z=

52 60 = 0.053 15.17

%i 9 15;' la regla de decisin es J *o recha&ar si -1.?4 Z 1.?4. <echa&ar si Z > -1.?4 o Z N 1.?4K. 6omo Z = -5.4: se puede concluir al nivel de significancia del 15; que los tiempos promedio de enfriamiento son los mismos para ambos m.todos de coccin. Pru"ba d" 8rus9a))-5a))is Es una prueba que compara tres o ms poblaciones para determinar si existe una diferencia en la distribucin de las poblaciones. Es anloga a la prueba F utili&ada en las pruebas /*OM/. *o importa la restriccin de que las poblaciones tienen que estar distribuidas normalmente.

Las hiptesis son) H0) 0odas las k poblaciones tienen la misma distribucin. H1) *o todas las k poblaciones tienen la misma distribucin. E$"(&)#! An nuevo gerente de /von debe comparar el tiempo que les toma a tres clientes pagar los env,os del nuevo producto *eP-Face 6ream' ofrecido por la empresa. %e seleccionan aleatoriamente varias compras de cada cliente' !unto con el n+mero de d,as que cada uno se tom en liquidar su cuenta. Los resultados aparecen en la 0abla 1.4. Tab)a %!: *+mero de d,as para pagar a /von la entrega recibida. C#(&ra 1 # : 1 4 ? = Estad,stico 3rus8al- Lallis) 1 #2 1E 1: #2 #E ## #1 6liente # #? #5 11 11 ## #1 : := #2 #? :4 :1

12 %i2 3( n + 1 ) n( n + 1 ) ni donde ni es el n+mero de observaciones en la i-.sima muestra n es el n+mero total de observaciones en todas las muestras. Ri es la suma de los rangos de la i-.sima muestra. Tab)a %!; <angos en la prueba de 3rus8all-Lallis. D<as Ran*# D<as Ran*# D<as 11 1 1: # 11 : 1E 1 #5 4 #1 ?.4 #1 ?.4 ## 2.4 ## 2.4 #? 15.4 #? #2 1: #2 1: #2 #E 14 :1 :4 := (=

Ran*#

15.4 1: 1? 1= 12

R1=62 6alculando el estad,stico ! se tiene)


(=

R2=34.

R3=74.

( 62 ) 2 ( 34.5 ) 2 (74.5 ) 2 12 + + 3( 18 + 1) = 8.18 18( 18 + 1 ) 7 6 5

Enseguida comparamos ! con un valor cr,tico. La distribucin de ! es aproximada por una distribucin chi-cuadrada con k 1 grados de libertad. %i ! excede el valor cr,tico de chi-cuadrada' se recha&a la hiptesis nula. En caso de seleccionar un valor de de 4; en la prueba de /von' el valor cr,tico de chi-cuadrado dados :-1 9 # grados de libertad es 2 0 .05 , 2 = 5.)) . R"*)a d" d"cisin0 N# r"cha.ar si k 5.)). r"cha.ar si k * 5.)) 6omo k 9 12.2 N 4.EE' se recha&a la hiptesis nula de que no ha" diferencia en el tiempo que toma a tres clientes pagar sus cuentas con /von. En el caso de que se rechace la hiptesis nula' el siguiente paso lgico es determinar cules diferencias son estad,sticamente significativas " cuales se deben a un error de muestreo. Esto involucra una comparacin de todos los pares posibles. Los pasos para la comparacin son los siguientes) 1. 6alcular el rango promedio para cada muestra.
62 = 8.86 7 34.5 %2 = = 5.75 6 74.5 %3 = = 14.) 5 %1 =

#. 6alcular diferencias absolutas


| %1 %2 |=| 8.86 5.75 |= 3.11 | %1 %3 |=| 8.86 14.) |= 6.04 | %2 %3 |=| 5.75 14.) |= ).15

:. 6omparacin con el valor cr,tico "k)

+k =

2 ,k 1

1 n( n 1 ) 1 + 12 ni n ,

( 18 )( 1) ) 1 1 = 5.)) + = 7.27 6omparacion del cliente 1 con el # 12 7 6 ( 18 )( 1) ) 1 1 + k = 5.)) + = 7.65 6omparacion del cliente 1 con el : 12 7 5 ( 18 )( 1) ) 1 1 + k = 5.)) + = 7.)1 6omparacion del cliente # con el : 12 6 5

1. 6omparacin de las diferencias contra los valores cr,ticos


| %1 %2 |=| 8.86 5.75 |= 3.11 < 7.27 (or tanto 1 " # no difieren | %1 %3 |=| 8.86 14.) |= 6.04 < 7.65 (or tanto 1 " : no difieren | %2 %3 |=| 5.75 14.) |= ).15 > 7.)1 " entre # " : si existe diferencia

C#rr")acin d" ran*#s d" S&"ar(an

También podría gustarte