Anlisis de los mtodos estadsticos a la solucin de problemas tcnico
1. Desarrollo Regresin Lineal Simple Y Mltiple Problema 1. n la !nidad conmica "sica #$ran% Pas# de Moa se desea conocer el peso promedio &ue alcan'arn las gallinas en el pr(imo trimestre. A )inal de cada trimestre estas gallinas son distribuidas a la poblacin * se inicia nue+amente el ciclo de crecimiento. Se conoce la cantidad de pien'o * agua consumida por estas ,uega un papel determinante en el peso de las mismas. n el actual trimestre se reali' un estudio donde se obtu+ieron los datos para -. gallinas. /0er ane(o 11. /Los datos recopilados no son reales1. Anlisis de la Regresin Simple. 0ariables2 0ariable dependiente2 Y. Peso de las gallinas en libras /lb.1. 0ariable independiente2 3. 4antidad de pien'o consumida en %ilogramos /5g.1 6cima de la pendiente. Planteamiento de las 7iptesis2 Si se acepta 89 2 la +ariable no es signi)icati+a./:o e(iste relacin lineal entre Y * 3 1. Si se rec7a'a 89 la +ariable es signi)icati+a /(iste relacin lineal entre Y * 3 1. $. +ariacin S.4 ;.L 4.M $ P Regresin 1.-<1=> 1 1.-<1=> =9<.> 9<9999 Residuos ..<>1. -- 1<?=1-? @otal A9=<91- -B
l coe)iciente de correlacin C 9<>.?1-1/las +ariables se encuentran relacionadas linealmente en un >.<?1-1D1. RA C E-<A=.= /Se 7a eliminado un E-<A=.= D de los errores con la regresin1. l error estndar C 1<-99.A 4omo el +alor de probabilidad es 9<9999F9<9. se R89 lo &ue &uiere decir &ue el pien'o es determinante en el peso de las gallinas. La ecuacin determinada para esta estimacin es2 6cima de la )alta de a,uste. /l modelo lineal proporciona un buen a,uste1. /l modelo lineal no proporciona un buen a,uste1.
l modelo &ue me,or a,usta es el S&uare RootG3 $. +ariacin S.4 ;.L 4.M $ P $.A -?<1.>- AB 1<.9?? 9<?= 9<EEE1 .P 1=<?.?E = A<1>B9E 4omo el +alor de probabilidad 9<EEE1H9<19 se A89 por lo &ue el modelo proporciona un buen a,uste. Anlisis de la Regresin mltiple2 0ariables2 0ariable dependiente2 Y. Peso de las gallinas en libras /lb.1. 0ariable independiente2 31 .cantidad de pien'o consumida en %ilogramos /5g.1. 0ariable independiente2 3A .cantidad de agua consumida en litros /L.1. 6cima de la pendiente $. +ariacin S.4 ;.L 4.M $ P Regresin 1EE<.>? A >><E=A= =9<B1 9<9999 Residuos -1<BAEA -A 9<=>A9== @otal A9=<91- -B RA C >B<=?B D RA a,ustada C>B<9AB- D rror estndar C9<==199= rror medio absoluto C 9<EBA>.> stadstico de 6urbin Iatson C 1<E?9.B. 4omo la probabilidad es menor &ue 9<9. entonces se R89< lo &ue indica &ue algunas de estas +ariables son tiles para 7acer estimaciones del peso de las gallinas /Y1. Mtodo paso a paso./paso alante 1 4on este mtodo podemos determinar cules +ariables del modelo son signi)icati+as. stadgra)o para entrar C B<1B=11 stadgra)o para remo+er C B<1B=11 n el paso nmero cero tenemos cero +ariables en el modelo con -B ;.L para el error * un coe)iciente de determinacin de 9<99 D. n el paso nmero uno adicionamos la +ariable 31 con un estadgra)o para entrar de >E<B=B= * como este +alor es ma*or &ue B<1B=11 esta +ariable &ueda en el modelo con -- ;.L para el error * un coe)iciente de determinacin de EA<?1 D. n el paso nmero dos adicionamos la +ariable 3A con un estadgra)o para entrar de A?<A>.= * como este +alor es ma*or &ue B<1B=11 esta +ariable &ueda en el modelo con -A ;.L para el error * un coe)iciente de determinacin de >B<=? D. 4omo podemos obser+ar< tanto el pien'o como el agua &ue consumen las gallinas son signi)icati+as en el peso de las mismas. l modelo tiene la siguiente ecuacin2 0eri)icacin de supuestos2 :ormalidad2 Si apro(imadamente el =. D de los residuos estn en el inter+alo de < entonces no 7a* ra'n para rec7a'ar el supuesto de normalidad. l inter+alo es /G1<=>A91>J 1<=>A91>1 Se cumple el supuesto de normalidad *a &ue el =B<A= D de los errores aleatorios se encuentran dentro del inter+alo indicado. 8omocedasticidad2 /8a* 8omocedasticidad1 Algn di)iere /:o 7a* 8omocedasticidad1 n C-. c C - p C- S.4 Residual ;.1 C AA< A9?E S.4 Residual ;.A C AB<-9? $ C 1< 9=B.-B. 1<9=B.-B.FA<.E?=- Se acepta 89 por lo &ue se cumple el supuesto de 8omocedasticidad. :o autocorrelacin2 /:o 7a* autocorrelacin1. /8a* autocorrelacin1 n C-. dl C1<-B- d+ C1<.>B R89 A89 R89 9 1<-B- 1<.>B A<B1? A<?.E B d C1<E?9.B. Se encuentra en la regin de aceptacin por lo &ue se cumple este supuesto. :o multicolinialidad2 /:o 7a* multicolinialidad1 /Si 7a* multicolinialidad1 R.42 R.42 H B<1-=AE Se R89 por lo no se cumple el supuesto de no multicolinialidad. 8aciendo un pronstico del peso &ue debera alcan'ar una gallina para un consumo de pien'o de 19<? 5g. * = L de agua obtu+imos un +alor de 19<.??= con un error estndar 1<9BA9B. 2. Diseo de experimento Problema A. n un estudio reali'ado por el ministerio de salud pblica se obtu+o &ue la ma*or parte de la poblacin cubana &ue padece de 8ipertensin Arterial se concentra en las pro+incias orientales. Segn criterios mdicos una de las causas )undamentales de tal en)ermedad es el rgimen alimenticio &ue lle+an las personas. Se pudo obser+ar adems &ue los alimentos &ue se consumen no pro+ocan el mismo e)ecto en la presin para los distintos 7orarios del da. s inters de todos conocer cules son los alimento &ue podemos consumir en ma*or o menor medida< los 7orarios en &ue son menores * ma*ores los +alores de tensin arterial< as como la me,or * la peor combinacin de estos )actores. Para darle respuestas a estas interrogantes se tomaron muestras de +alores de presin por ? das en di)erentes 7orarios del da de una persona. /0er ane(o A1. Anlisis de +arian'a para datos tipo KKK $. +ariacin S.4 ;.L 4.M $ P P. )ectos A2 $actor A. 1E--<-- A >??<??E -=<99 9<99AB "2 $actor 8. 1A99<9 A ?99 AE<99 9<99B> 42 Rplic. .<....? 1 .<....? 9<A. 9<?B-- Knteraccin A" A??<??E B ??<???E -<99 9<1.?A A4 -11<111 A 1..<..? E<99 9<9B=B "4 BB<BBBB A AA<AAAA 1<99 9<BBBB Residuos >><>>>= B AA<AAAA @otal -?.9<9 1E Anali'ando el PG+alue del )actor A. se obtu+o &ue para se rec7a'a 89 lo &ue signi)ica &ue 7a* di)erencias signi)icati+as entre los alimentos &ue se consumen< por lo &ue la +ariable es signi)icati+a en la inestabilidad de la presin. 8aciendo el mismo anlisis para el )actor 8. se obtu+o &ue para se rec7a'a 89 lo &ue signi)ica &ue 7a* di)erencias signi)icati+as entre los 7orarios del da en &ue se toma la presin< por lo &ue la +ariable es signi)icati+a en la inestabilidad de la presin. 8aciendo el anlisis para las rplicas se obtu+o &ue para se acepta 89 lo &ue signi)ica &ue la +ariable no es signi)icati+a en la inestabilidad de la presin. n las interacciones tenemos &ue solo es signi)icati+a la interaccin del )actor A con las rplicas. Para obtener en cules 7orarios * en cules alimentos estn estas di)erencias signi)icati+as se uso del mtodo de 6uncan obtenindose2 Pruebas de rangos mltiples para los datos por el $actor A. Mtodo de 6uncan con =. D $actor A. 4onteo Media LS ;rupos 8omogneos 0erduras 8arina Sal ? ? ? 11><--- 1-.<9 1B1<??E 3 3 3 4ontraste 6i)erencia 8arinaGsal 8arinaG+erduras SalG+erduras G?<????E L1?<???E LA-<---- 6e a&u se deduce &ue e(iste 7omogeneidad entre los alimentos 7arina * sal * e(isten di)erencias signi)icati+as entre 7arinaG+erduras * salG+erduras. Pruebas de rangos mltiples para los datos por el $actor 8. Mtodo de 6uncan con =. D $actor 8. 4onteo Media LS ;rupos 8omogneos Meridiano :oc7e maMana ? ? ? 1A1<??E 1-1<??E 1B1<??E 3 3 3 4ontraste 6i)erencia MaManaGmeridiano MaManaGnoc7e MeridianoGnoc7e LA9<9 L19<9 LG19<9 6e a&u se obtiene &ue e(isten di)erencias signi)icati+as entre los tres 7orarios. Para el $actor A. 47e&ueo de +arian'a. Prueba 4. de 4oc7ranNs2 9<.?.A1E PG+alue C 9<AE=-EA Prueba de "artlettNs2 1<1..=> PG+alue C 9<-?>BE. n la prueba de 4oc7ranNs PG+alue H 9<9. n la prueba de "artlettNs PG+alue H 9<9. Se cumple el supuesto de igualdad de +arian'a. Para el $actor 8. 47e&ueo de +arian'a Prueba 4. de 4oc7ranNs2 9<BBA1EE PG+alue C 9<EB==E? Prueba de "artlettNs2 1<1E>E= PG+alue C 9<-AA9EB n la prueba de 4oc7ranNs PG+alue H 9<9. n la prueba de "artlettNs PG+alue H 9<9. Se cumple el supuesto de igualdad de +arian'a. Para el $actor 4ombi. Pruebas de rangos mltiples para los datos por el $acto 4ombi. Mtodo de 6uncan con =. D $actor 4ombi. 4onteo Media ;rupos 8omogneos > = E . A ? - B 1 A A A A A A A A A 11.<9 11.<9 1A.<9 1A.<9 1A.<9 1-.<9 1B.<9 1B.<9 1..<9 3 3 33 33 33 33 33 33 3 4on el e(perimento anterior llegamos a la conclusin de &ue los alimentos &ue debemos consumir en ma*or proporcin son las +erduras * los &ue menos debemos consumir son a&uellos &ue contengan alto contenido de sal. l 7orario del da en &ue la presin alcan'a menores +alores es el meridiano * ma*ores +alores por la maMana. La me,or combinacin es +erdurasGmeridiano * la peor salG maMana. 3. Series Cronolgias Anali'ando el problema anterior pero con datos correspondientes a cuatro semanas se desea anali'ar el comportamiento de la presin en cada semana as podra comportarse en los pr(imos das. /0er ane(o -1. 1. @t C "9 Media2 1-=<?BA= 0arian'a2 1.-<BB-= Modelo 7brido. A. Serie de tendencia constante estacional con perodo E. "9 C1-=<?B- p C E n C A> /11 C1<9EB /A1 C 9<=?E /-1 C 1<9EB /B1 C 9<=?E /.1 C 9<>.= /?1 C 9<=>. /E1 C 1<9EB 0arian'a2 ?-<E.99 6es+. @pica2 E<=>BB -. stimacin * c7e&ueo. B. 6iseMo de pronstico. 8ori'onte /512 A : C A> m C A> n C 1B $uncin de pronstico2 /11 C 1<9?9 /A1 C 9<=E1 /-1 C 1<9?. /B1 C 9<=E. /.1 C 9<>.1 /?1 C 9<=.- /E1 C 1<9=B Media de los errores2 G .<-?1 Suma de cuadrados2 =>9<A=> 4uadrado Medio2 E.<B9. Ra' del 4uadrado Medio2 ><?>-E.A 4lculo del inter+alo de con)ian'a para un ni+el de con)ian'a de =. D. Pronstico para @ C -92 1-A<E-E- Knter+alo de con)ian'a para el pronstico /11.<9=J 1.9<->1 6es+iacin stndar /1<A. 6AP12=<99A? 0alor del 6AP2 E<A9 4oe)iciente de alisamiento del 6PA2 9<A.9 METODO DE TU!E" #n$erenia de los par%metros del modelo. Intervalos de confianza de los parmetros. Se consideran dos situaciones2 Se aepta &9. Si se acepta la no in)luencia del )actor los datos pro+ienen de una nica muestra 7omognea * los parmetros * A se estiman segn las tcnicas clsicas. /-.A11 /-.AA1 Se re'a(a &9. Si se supone &ue el )actor in)lu*e< entonces los parmetros del modelo son2 1,..., I * A . Los estimadores son Los inter+alos de con)ian'a se calculan a partir de las siguientes distribuciones2 Para i C O i &ue permite obtener el siguiente inter+alo de con)ian'a a un ni+el 1 G /dado en /-.1= 11 Para la +arian'a A se utili'a el estadstico pi+ote /dado en /-.1? 11 de donde se deduce el siguiente inter+alo de con)ian'a dado en /-.1E 1. Di$erenia entre dos medias. Si se rec7a'a la 7iptesis nula es por&ue e(isten medias de tratamientos di)erentes * es importante calcular un inter+alo de con)ian'a para el parmetro C i G j, con i j, i,j C 1,...,I. ste inter+alo se deduce )cilmente del siguiente estadstico pi+ote &ue proporciona el siguiente inter+alo de con)ian'a a un ni+el 1 G 3.5.2 Concepto de contraste. Lo e(puesto en el apartado anterior puede generali'arse. Para ello se introduce el siguiente concepto2
P Se denomina ontraste) , a cual&uier combinacin lineal de los e)ectos de los tratamientos
n un diseMo completamente aleatori'ado todo contraste es estimable * su estimador mnimoGcuadrtico es
Por la normalidad e independencia de las obser+aciones< se obtiene la distribucin de /-.A?1 n muc7os casos es til representar un contraste por la lista de sus coe)icientes. sto es< el contraste se puede representar por cual&uiera de las dos )ormas e&ui+alentes siguientes2
4ontrastes importantes sobre los &ue es interesante 7acer in)erencia son los siguientes2
* Comparar tratamientos a pares +,pair-ise./. Son contrastes del tipo2 C i G j< donde el +ector de coe)icientes es un 1 en el iGsimo lugar< un G1 en el jGsimo lugar * un 9 en el resto. Por e,emplo< C Q9,9,1,9,...,9,G1,9R sera el contraste - G IG1. (isten m C /I A1 contrastes de comparaciones por pares
s decir< estimar contrastes del tipo2 C i G j< donde el +ector de coe)icientes es 1 en el iG(imo lugar< un G1 en el ,Gsimo lugar * un 9 en el resto. Por e,emplo< =Q9,9,1,9,...,9,G1,9R sera el contraste - G IG1. (isten m C contrastes de comparaciones por pares.
* Tratamientos $rente a ontrol. !n subcon,unto de contrastes del grupo anterior mu* particular es el )ormado por los I G 1 contrastes 1 G I /Q1,9,...,9,G1R1< A G I /Q9,1,...,9,G1R1< ... < IG1 G I /Q9,9,...,1,G 1R1. l ob,eti+o es comparar el e)ecto de cada uno de los tratamientos con un tratamiento concreto< &ue se suele denominar ontrol.
* Di$erenias de medias de gr0pos. Si los ni+eles de los )actores tratamiento se di+iden de un modo natural en dos o ms grupos< puede ser interesante comparar el e)ecto medio de un grupo con los e)ectos medios de otros grupos. Por e,emplo< supngase &ue se desea comparar el e)ecto del color del papel de e(amen en los resultados )inales de ste. Se 7a probado con dos tonos claros2 blanco * amarillo /ni+eles 1 * A del )actor1 * con tres tonos ms )uertes2 a'ul< +erde * rosa /ni+eles -< B * .1. l siguiente contraste2
permite obser+ar di)erencias entre la in)luencia del papel claro /grupo 11 con respecto a la del papel oscuro /grupo A1. * Tendenias 4uando los ni+eles del )actor tratamiento son cuantitati+os * tienen un orden natural< el e(perimentador podra estar interesado en saber si la respuesta crece o decrece con un incremento del ni+el o< ms an< si esa tendencia se mantiene o no constante. Se 7abla entonces de ontrastes de tendenia. Por e,emplo< supngase &ue 7a* I C . ni+eles de un )actor son e&uiespaciados * con igual tamaMo muestral en cada grupo. Suponiendo S C S1 C SA C S- C SB C S. el siguiente contraste indica una tendencia lineal en los ni+eles n el mismo conte(to< una tendencia cuadrtica +iene dada por el contraste n general< si C i C 1 I bi i es el estimador mnimo cuadrtico de un contraste indi+idual C i C 1 I bi i< con i C 1 I bi C 9. ntonces< de /-.A ?1 se deduce &ue un inter+alo de con)ian'a para < al ni+el 1 G < +iene dado por2 (3.27) donde g.l. representa los grados de libertad con &ue se 7a estimado la +arian'a del error. n el modelo del diseMo completamente aleatori'ado al estimar A por la +arian'a residual< R A < con n G I grados de libertad< se obtiene (3.28)
Anlogamente< utili'ando la distribucin del contraste C i C 1 I bi i, dada en /- . A?1< se pueden reali'ar test de 7iptesis del tipo /-.A=1 3.5.3 Contrastes mltiples. Si el test de la F de la tabla A:T0A indica rec7a'o de la 7iptesis nula de igualdad de las medias de los ni+eles< es importante establecer la 7iptesis alternati+a adecuada *< para ello< son de gran utilidad los contrastes mltiples. n ocasiones se &uiere reali'ar un nmero mu* grande de comparaciones< de modo &ue la probabilidad de &ue alguna comparacin indi+idual resulte signi)icati+a puede ser errneamente mu* grande. Si se &uieren resol+er todas las pruebas de 7iptesis siguientes2
(isten m C C pruebas /por e,emplo< si I C ? entonces m C 1.1. Al resol+erlas una a una< con ni+el , se denomina Aij al suceso2 ntonces2 Sea el suceso2 A C rechazar errneamente alguna H9 ij C ij m Aij. U4ul es la probabilidad de AV Suponiendo &ue los Aij )uesen independientes /ob+iamente no lo son12
Si C 9 W 9. * m C 1.< entonces P/A1 C 1 G 9 W =. 1. C 1 G 9 W B? C 9 W .B. Por tanto< la probabilidad de concluir errneamente &ue algn par de tratamientos son signi)icati+amente distintos es ma*or &ue 9 W .B. 8a* distintos mtodos para abordar el problema de la resolucin de pruebas de 7iptesis simultneas /es decir< garanti'ando para todos ellas un ni+el de signi)icacin predeterminado1. !nos 7an sido desarrollados con carcter general * otros orientados a problemas concretos como puede ser la comparacin de distintos tratamientos con un tratamiento control. A continuacin se e(ponen dos mtodos de resolucin de contrastes mltiples. M1todo de 2on$erroni. Se basa en calcular un ni+el de signi)icacin< * < para cada una de las m pruebas de 7iptesis &ue garantice un ni+el de signi)icacin concreto para todas las pruebas de 7iptesis simultneas / es por tanto el ni+el de signi)icacin global1. Supngase &ue se tienen I ni+eles * m pruebas de 7iptesis indi+iduales. Sean los sucesos2 Ak 2 Paceptar la hiptesis nula el c!ntraste k"#sim! cuan! #sta es cierta$. A 2 Prechazar errneamente la hiptesis nula e un! ! ms c!ntrastes$. UXu * 7abr &ue utili'ar en cada prueba de 7iptesis indi+idual para garanti'ar &ue P/A1 no es ma*or &ue V
/-.A=1 Por tanto< para el modelo matemtico de un diseMo completamente aleatori'ado< el mtodo de "on)erroni consiste en resol+er cada prueba de 7iptesis indi+idual con)orme al siguiente criterio2
6ado un con,unto de m contrastes j C 1 m < rec7a'ar la 7iptesis H9 j 2 i C 1 I bi j i C 9< a un ni+el de signi)icacin global no superior a < siempre &ue
/-.-91 0enta,as * des+enta,as de este procedimiento son las siguientes2 Y Si m es mu* grande< ser tan pe&ueMo &ue tnGI no +iene en las tablas. Se puede apro(imar por2 donde z es el +alor de una normal estandar tal &ue P C . Y s mtodo es e(cesi+amente conser+ador * slo resulta ms potente &ue otros procedimientos cuando m es mu* pe&ueMo. Y s +lido para cual&uier tipo de diseMo. M1todo de S'e$$1. l mtodo de "on)erroni presenta serios incon+enientes< en particular< si m es mu* grande la mnima di)erencia signi)icati+a al ni+el global para cada prueba es e(cesi+amente grande. Por el contrario< el mtodo de Sc7e)) proporciona una mnima di)erencia signi)icati+a &ue no depende del nmero de pruebas m a reali'ar. l +alor crtico de Sc7e)) es de modo &ue< para cual&uier contraste indi+idual i C 1 I bi i se rec7a'a la 7iptesis H9 2 i C 1 I bi i C 9< a un ni+el de signi)icacin global no superior a < siempre &ue /-.-11 D#3E4ENC#A M5N#MA S#6N#3#CAT#7A La 6i)erencia Mnima Signi)icati+a /6MS1 slo debe emplearse para comparar medias ad*acentes en un arreglo ordenado< aun&ue tambin se puede emplear para comparar las medias con un testigo o tratamiento estndar. La 6MS es una prueba de t de Student &ue utili'a la +arian'a combinada< es decir2 Sd es el error estndar de la di)erencia * su clculo a partir de los datos de la A:60A es como sigue2 6onde2 4M es el cuadrado medio del error r es el nmero de repeticiones. ,emplo2 A:60A $uentes de +ariacin S4 ;L 4M $ @ratamientos 9.E- B 9.1>A. B.11=? Repeticiones 9.9=? A 9.9B> 1.9>-. rror 9.-.B > 9.9BB- @otal 1.1E=9 1B l +alor de la t se toma de la tabla con los grados de libertad del error. Si la di)erencia entre dos promedios seguidos e(cede el +alor de 9.-=E< se la declara signi)icati+a al ni+el del .D. n este e,emplo< la 6MS indica &ue no 7a* di)erencias signi)icati+as entre tratamientos ad*acentes< pero la $ de la A:60A indica &ue s e(isten di)erencias si se comparan medias no ad*acentes< en este caso< el in+estigador podra optar por otro tipo de prueba de rango mltiple. Promedios ordenados " >.9. A E.>. 4 E.EB 6 E..1 E.B.