Está en la página 1de 24
149 2.2.6 Distribuciones extremas Se trata del estudio de ta distribucin de los v ids los, o mis bales, de eae ies m viene oe dos en cada una de N muestras y que llega tener forma asintética a medida que m crece indefinidemente. Segin la forme de la distribucién inicial de los Nm valores se tienen tres tipos de distribuciones extremas de tipo asinttico, ‘A continuacién se exponen los tipos I y TIL que son Jor que se usan en Hidrologia, | Tipo I. Se la llama también dstribucién de Gumbel, Esta distribucién se deriva de otras de tipo exponencial que convergen hacia una funcién exponencial a medi da que x erece. Ejemplos de las distribucionesiniciales pueden ser Ia normal, la x2, y In logaritmiconormal. La funcién de densidad de esia distribucin de tipo I Pix) = ae-ew” seven 6.65) donde © 0 gor (2 2 3.67) G2) =0 para x50 siendo 2 = x mero de grados de libertad de la distribucién, Esta distribucién recibe el nombre de x? y tiene una importante aplicacién para comprobar ta bondad de tin juste de una muestra a una distrib vveremos y en general, a toda la t muestra, 3.27 3.28 Nociones de estadistica funcién de densidad f(y) decrece mo- Rétonamente, mientras que para n > 2 existe un méxi- ‘mo tnico en el punto La distribucién x2 esté tebulada (tabla A3.4). En muchas aplicaciones es importante hallar la probabili- dad P de que la variable x* tome un valor que exceda una cantidad dada x2. Esta probabilidad es igual al rea de la rama de la curva de densidad situada dlerecha de una ordeneda que pase por el punto x ~ Yo por tanto: P= Pot > xd) =f fed = 1- [7 sade 668) 2.2.8 Distribucién t de Student ‘Sean dos variables aleatorias independientes § y 1, la primera con una distribucién normal (0,1) y la se: ‘gunda con una distribucién x? con n grados de libertad. Se demuestra que la variable tiene como funcién de densidad: (Ht 1 164) (5.69) que define Ia distribucién t de Student (tabla 5.5) Esta distribucin es simétrica y para grandes valores de n las curves f(t) se aproximan estrechamente a la curva normal tipificada to=gip et La media de Ia distribuci6n ty = 0 La varianza de la distribucién o = ——— tio ‘se H yucién de tna poblagi 4 se considera Ia funeién #2) = PVR: DyS2) oe cae A Pc, sea meet 8 ie Se a pot he derostrado que Sc pretee van lim 9,(2) = KO ‘que es una distribucién asintdtica tabulada (tabla A36 de la que ge hard uso més adelante. 23 TESTS DE BONDAD DEL AJUSTE Dé UNA MUESTRA A UNA DISTRIBUCION En la préctica se tienen que tomar a menudo, desi siones sobre problemas partiendo de la informactn ‘obtenida de una 0 varias muestras de esas poblacions. Para ello, conviene hacer determinados supuestos 0 hhipétesis estadisticos acerca de las poblaciones que s¢ estudian. Si en el supuesto de que una hipétesis deer mminada es cierta, se encuentra que los resultados obs vvados en una muestra tomada al azar, difieren signifies esperar de la hipétesis se jones de rechazarla o de no sceptatla, Si se rechaza una hipétesis cuando deberta ser step ae se dice que se comete un error del tipo I. Si por cl contrario, se acepta una hipétesis que deberia s rechazada, se dice que se comete un error del tipo Il ‘Logicamente, se debe tender a minimizar ambos tipo! de gro, pero ello no es sempre posible. 3c llama nivel de signficacién de un ensayo a lap oni eg ee naa tun error del tipo T. En la préctica se acostumbra utili! niveles de significacién de 0,05. En estos casos, s¢ tet un 95 % de confianza de que se toma la decisién al? cuada, Hay que tener en cuents jinimiz a : {que el minimizar errors wa fare ermalmente a aumentar los del trot Nor ue, si el nivel de significacién es mt " (000), existe In posblidad de que ae acele hips que deberia ser rechazada (error del tipo !, ‘ara calcular un parémetro estadistico es necest ig wt Distribuciones de probabilidad 3.2 qua AS4 Porcentajes de 1a distribucién y? P om n grados de libertad. (Represetan dreas situadas a la izquierda del ri are valor dey) ee eT ete) een aae | hel nl ce) Pal aml ge 1 788 G85 502 384 2,711.52 0455 0,102 00158 00059 o,0010 opoc? 00000 2 106 921 738 5.99 461-277 439° 0575 OZ11 O,10s 00506 OG201 OOD 5 2B MS 935 781 625 4A 2371210884 0352 0216 ois, COT? 4 49 155 ALL 949778539536 1192106 O71 04es 0297 0207 5 167 151 128 ILL 9.24 663435267 16L 1S OBS 0884 O4I2 6 185 168 144 126 106784535 5452201164 1.280872 OBIE 7 23 185, M41 120940635 425283271169 124 0.988 8 9 29 201 135154 102734507 5492732816534 3S 27 190 169 147 116 834590 7335 270 209175 fo 22 252 25 185 160 125 934 674 487 3.94 fu 8 247 219 197 7s 137 1037585358 | | 25 262 253 210 85s 13 bas 630 325 256 216 457 382 305 260 523 440 337 307 15 298 27 247 224 198 160123930 70k 5389 5014387 4 33 298 257 21 TASS 102779857563 465407 15 328 306 27,5250 25 182 SMBS 726 626523460 43320 288-265 5,5 194153 11993179691 SB 54 7 357 354 302 276 «248-205 163128 10,1887 756 GAL 5.10 8 575 348 515-289 260216173137 109939825 TOL 26 9 386 362-329-3012 2271834 10891763884 316 M2 314 8A B19 SS 1241099459826 TAS 21 414 389355327 296-203 1631523890 2 (428 40,3 368 339 «508 2002133 1724 1S SB B42 416 381 3552320271 SLB AST 1029326 4 456 (450 394 364 352 282 5S 190 157 138 124 «109g B 69 45 406 377 MA 23 MS 199 165 46 151 1S 105 % 483456 «419 38935650453 BTS SAB 2 7 496 470 452 «401 «367 S15 263 7 BL 18214629118 % 510 483 445 413 379 (326 ST 89169153136 15 DB 23 496 457 «426 «39,357 283336 «98177 64S ASL & & Deis: is GR. GM a! wih oSUlesquae wits, Gene ey a Bee 8 0s SA ee es ae eee, a a © I95 14 152 36S HS. 42937734 AT 28D @ op ma BO ml MA 6m) 503 M3 465 42 40S HTS 8S ; 5 116 63 617 553 517 488 454 433 ee ioe a wa 96,6 «881 793 TL 643 GOA S72 535512 1793 1241 1181 113A _ 1078. 986 093 O06._753 GOL 656 GLB 382 402 1358 1296 1243 1185 109, 99,5 901 82479742 TOL 67,5 3.30 Nociones de estadistica ‘Tama ASS Distribucién t de Student Para un porcentaje p, el valor t, de la distibucin t, PUt| >) = Por consiguiente la probabilidad de que tdifiera 109 se define por ta condic «desu media en ambos sentidos en més de te igual a py ‘yon feign den yD a 4 of cy 0 50 “0 30 ~» 10 aw 0325 10001376 1965. 5073 6314 12,706 51821 65.657 Sieg 0289 Osis Loot 1388 1886-2920 4305 6965 9975 slap oz Ores Oars 1250 ose 2388 38245615241 aay o2n Oral Ogat 1190 1333-2152 27763747 4804 kag 0267 Craroam) (ise 476 2015, 257133654052 ay 076s O78 0900 LI Lad 98S 244751435707 Sa 0265 Ort 0896 11914151895 2565 2998 5459S 0262 0705 0889 1597 1860 2306 28963385 5 0261 0703 088s 1383 520 im 0260 0700 og79 109s 1372 51650, 0260 0897 O76 1088 11365 596 4a, 0259 06950875 108s 11356 30555 0259 0694 0870 10791350 302 ta 0258 0692 0868 107) 1345 zon 4a 0258 ogi oes Lars 341 2oe 4M 0258 06900865 tom 1337 2e1 4s 0257 0689 0865 10091333 28 38 ozs? 01880862 10671350 258 st 0257 08s gst 1060 1328 2861 38 0257 O57 0860 10661525 2a 38) 0257 0686 0859 10651251 251 38t) 0.256 0686 0858 106115321 2819 3 0256 0685 0558 1080 1319 2a 38) 0256 0685 0857 10591318 2ys7 315 0256 0684 0856105813516 2787 38 0.256 068 0856 10581315, Zi sil 0256 066 OSS 1057 13t4 are 0256 0389 0685 0855 10561315, er) 0255 0589 0685 054 10551311 50 0255 0389 0685 0854 10551310 sa 0255 0368 0681 O85 1050 1305 Zio 8 0254 0387 0679 ORK 1046 1396 si O254 0388 0677 omts Loa 1389 20 3 0255 0385 0674 082 1,056 1282 ie ——<— —— — Tr 183 quia ASS Disiibucién de Kolmogorof probebilided 3.3" =, ell = = x) xo | 2 | mo] = | Ko on 00000 | 072 0305 | 112 6, eal elie uel eee ee °: ¥ 3560 | 14 : wy | ars Sees | tis sa | ik ee | 5s coms | 076 o3a9s | tie ose | t's oases | tse oat sagem | 077 ouoet | ir ger | ig ams | tt tp, ¥ 118 og 3 O32 opoia.| 079. oases | 14s oaees | tap cass | tos Saves dao onze | 050 oss | 120 oser7 | too oseeo | 200 Gases cat p04 | 081 04720 | 121 osso | 61 ossss | 201 0.9904 oxz 0055 | 082 ose | 122 ogsat | 162 09895 | 202 0.9904 04s —0p07 | 085 0.5058 | 123 09050 | 1163 09902 | 205 0.9995 ome 0007 | 084 —osis¢ | 1724 09076 | 1164 09908 | 204 0.9995 oas © opi2s | 085 ossa7 | 125 osiai | 165 agai | 205 09996 ons opie | 086 05497 | 126 opie | 166 ogi9 | 206 0.9996 car 00200 |. 087 064s. | 127 tie? oge2¢ | 207 0.9996 cas on247 | og o57a1 | 128 ozs | 168 0.9929 | 208 0.9996 cas 00300 | 089 05055 | 129 09283 | 169 09934 | 209 0.9807 050 0361 | 090 06075 | 130 ossi9 | 170 9938 | 210 09997 os1 opie | os1 oga09 | 131 oss | 171 0942 | 211 09997 052 050s | 092 o@s4s | 132 08387 | 172 o9m46 | 212 0.9997 053 opses | 09s ogt7s | 135 ogeis | 182 09973 | 215 09998 05¢ 09675 | 09% osor | 134 ogH9 | 185 09975 | 214 0.9998 035 oo772 | 095 06725 | 135 09478 | 184 09977 | 215 Og98 036 00876 | 096 06846 | 136 0.9505 | 185 09979 | 216 0.9998 037 oper | 097 06964 | 137 0.9531 | 186 09980 | 217 09998 058 ojio4 | 098 07079 | 138 0.9556 | 187 oaset | 218 0.9999 059 0.1228 | 099 oi | 139 0.9580 | 188 ogsas | 219 0.9909 ago 0.1357 | 100 07500 | 140 0.9003 | 189 ogsse | 220 0.9999 as o,t4a2 | tor 040s | 141 0.9625 | 190 ogges | 221 0.9999 062 —ones2 | 102 0.7508 | 142 09646 | 191 0.9986 | 222 0.9999 06s ors | 105 0.7608 | 143 0966s | 1,73 0.9950 | 225 0.9999 os 0927 | 104 0.7704 | 144. 96s | 1.74 0.9955 | 2.24 0.9989 065 02080 | 105 07798 | 145 09702 | 1,75 0.9956 | 225 0.9999 066 02256 | 10s 0.7889 | 146 9718 | 176 09959 | 2.26 0.9899 467 02306 | 107 07976 | 147 09734 | 177 09962 | 227 0.9999 968 2558 | 108 ogost | 148 09750 | 1,78 0.9965 | 228 0.9988 06 ozre2 | 19 ogias | 149 Os76+ | 1.79 0.9967 | 229 09999 070 ozees | 110 08223 | 150 09778 | 180 09969 | 2,30 09999 on oss | ini oaza9 | 131 97a | 181 osm | 281 1.0000 basarse en los datos obtenidos de las muestras y en cier- tos pardmetros de la poblacién. El mimero de grados de libertad de un estadistico se define como el niimero N de observaciones independientes en la muestra (es d cl tamafio natural) menos el nimero K de pardmetros de la poblacién que han sido estimados a partir de las observaciones de Ia muestra. Es decir, n = N— k. Frecuentemente, los resultados obtenidos de las mues- ‘tras no concuerdan exactamente con los resultados teéri- ‘cos esperados. Seguidamente se analizan dos métod para contrastar Ia hipétesis del ajuste de una muest 8 una distribucién, métodos que se denominan general- mente Tests de Bondad de un Ajuste. 2.3.1 Test 1? Una medida de la discrepancia entre las frecuencias 0, observadas en una determinada muestra y Ins frecuen- clas ¢, esperadas, es decir, tas que deberfan ocurrir si se tratara de una distribucién tedrica, es suministrada por el estadistico x (Iéase chi-cuadrado), dado por: (1 =e) a pe Oe Gre 7 e 4p Gua eaP ¥ oP ca Terre, 07 EO=N Eq=N jm) donde N es el ndmero total de fresuencias o el mero deinevaer deca on ole deg I dato Mieran grapedos en intervals, son las frecuencia Uolutas cbservedas, bien de cade auceto 0 bien de ada intervalo do clase o=fhx f00)- dx NL lode Ly Ly $n los limites superior e inferior del inter $e de'dase yf) es la Tuncn de densidad de la Uinibolén wedge ala que so supone.perenece 1 njnibuctn muestra de eaproxia muy etre chamonte a le distbucion 2 esudiada on 227. ur admero de grads de iberad ex N- 1 ~¥ =n. Bonde'N es ef'nimero de intrvalo de clase y¥ es 1 Fo Mi Ke MB Me ¥ Figura 3.14 Empleo de intervalos de clase iguales para obtener las frecuencias relativas observadas en un fest x’. ‘Las frecuencias relativas esperadas son diferentes. cl nimero de parimetros de a poblacién que hay que ‘estimar a partir de las estadisticas muestrales peta calcu lar as frecuencias e, esperada Si se utilizan frecuencias relat Le & -| f(x)dx L, Se pueden utilizar intervalos de clase igual cot Jo que las frecuencas relaivas © probabilidades expe dus de cada uno de ellos serén, en general, dif Por ejemplo, sea una distribucién normal y se tom 5 intervalos'de clase iguales; la probabilided de cla tno de ellos sera distina (ig. 5.14). Para el primero ser Para el segundo Py — Para el quinto Py = Py 1 — Py as diferencias relatives observadas serén Ios i correspondan a cada uno de esos intervalos de li iguales Otra forma de aplicar el test es establecer que cat intervlo do clase tiene 1a misma frecuencia tl esperade. Por ejemplo, si se hacen cinco intros la frecuencia relativa esperada de cada uno de ell: #4 1 02. En este caso las frecuencias relativas observadas as que correspondan a cada intervalo de clase defi? 16 xX XX ru 3.15 ‘npleo de funciones relativas esperadas iguales en um test y*. | Las intervaos de clase obtenidos son diferentes. alhacer que su frecuencia relativa esperada fuese 0,2, ts decir, las frecuencias relativas observadas entre 0 7%, entre x; ¥ %, etc. (fig. 3.15) Normalmente, el minimo némero de intervalos de clase a emplear oscila entre 5 y 9, ya tamafios de la nuestra mayores, menor ndmero de intervalos de clase. Una vez conocides 0, y ¢, se halla el valor de x @-eF te ‘A continuacién, y teniendo en cuenta el némero de perimetros de Ia distribucién estimados, se calcula el mero de grados de libertad. Para obtener un porcentaje de confianza C%, es decir, para comprobar nuestra hip6tesis con un nivel de sigifcacién $ % = 100 — C, se entra en Ia tabla A3.4 con el nivel de confianza C deseado y con el ntimero de frados de libertad; se obtiene asf un valor x.*. Six sau eo bau ‘itmico normal, en abscisas figuran las probablidaes & rmuladas en 9% y en ordenadas los eaudales espeiis# eee scala logeritnice. Se ajusta estima una recta 2 8 P se {os obteidos. Asi se dibuja la recta A (ig. 316) A A3. So supone que x. S. La medi & Aistrbucion logariimica normal ts (ver 224) wo Seat Perey one os pee poy te Pele fen Pi) 50 = Keegan wg Ext _ O88 seg origernian Wea z 7 Por consiguiente, un punto de la recta serd (50%, 08 nee ae! * Pendite se balla etanda i deni $= VOWITOOpIw = 0,148 eee 1e Cro o4 —l 487 Frama 5.6 Fiemplo 4, =In 2,14 = 0,765 ms o8n Sono In xa = Yo + 04; In uss = = 1,484; nan = 0227 0039 ‘nton= —2358 4 0874 bh tao —2558 — 0874 = 5252) xan 4 Jo 9%; 022% que otros dos puntos serin: (15,87 %: {346 Oss) Representando los tues punts en of gr ‘4 definida la recta B (fig. 5.16). Distibuciones de probablided 3:36 34, Ajuste de Ia recta A a Ia muestra. Tnieralo teria deca comenoniiente gat Ute probibidnd ‘ecco 020 >0m 56 308 036 2040 0240115 3.83086 4060 0115000236 «628576, 6080 00620030368 «308 (036 wi =< 008036 308 6 3.36 Nociones de estadistica de pues 18 1m trcenls prada Be ‘nde intervalos md pre ashes gn tore ineie Oy eda pean vie a Ha x ais Spe acta tea See ieee ir pd de fad cal ba ASA, w btn que weet ie f= 2 menor gue a! = 7.78 seo bane Tet Ale de ert Bt mc == be i ta See om) ais al al wn one 20. -omsuts ies, ae OM fea tigows 38 3 os Ose So Sere ie me Ae Be eae S/O Go 50 te Oa 8 ay £ f 36 und st tas etinale 2 pahocts Gann 7 #28 el nimero de grados de libertad es: 5— 1 Para 2 grados de libertad se obliene en la tabla A.34, n= 461. Como x= 145 es menor que x= 4,61, el ajuste es bueno para el nivel 90%. No obstante y pese al resultado obtenido, debe advertire que la hipétesis de estimacién de estadisticos del enunciado No os adecuada. 'A'5. Para calcular la desviacién tipica de la distribucién representada por la recta A, se sabe que: Yo = ln xpi 2045 In Xyu7 In Xu; Ma = 0 MEE Sex(et- 1) fos valores Xo, Xsan ¥ Xu se deducen de In recta A y son Jos siguient 1084; xysr = 0.292; xn» = 00248, luego: eS ye= ln 0084 = —248 In 0.292 — In 0248 In 03292 ~ In 00048 _ z =1231 = (3497) z 1285, y por lo tanto: 1155. Ve ‘Ast pues, Ia desviacién tipice de le distibucién de 1, poblacién estimada a partir de Ia recta A ajustada a ‘rucstra, diflere de Ia desviacién tipiea de la muestay g mayor que ell 'B. Un caudal de 50 I/sey en un pozo de 100 m depen. tracién y 10 m de descenso, equivale a un ceudal espetio en I/seg/mt Ed 10% 100 q 105 1/seg/m? eb Entrando on este valor. en le represents ‘rdficamente por Ta recta A, se ten Pla > 005) = 68 % y en la distribucién representada por Ia recta B: Pla > 005) = 78,5 96 La pendiente de lat rectas es funcién de ta desvisile Uipiea. Al ser ésta menor para la recta B, su pendiete ‘menor, lo que representa que da probabilidades mayor pata valores de 4 <012 1/seg/m* y mayores si q> Oi? 'Ysee/tm? que tos proporcionados por la recta A. 24 METODOS DE ESTIMA‘ Log, PARAMETROS DE UNA Ine TRiBUCION En el apartado 1.17.1 se hi « .17.1 se han expuesto los conc! Disios de la teora de estimacisn estaditicny € 8 fcamiento general del problema de estimacidn é& Pacts dune poblstn, xisten diversos métodos para la estimacién & armeres de una poblacign, a partis de ls dats OF ni le la muestra, idamente se describe un orden de precisién decreciente en Ia estimacioa- 19 At Método de la maxima verosimilitud | método general més importante desde | Fea rerio y ha sido desarrollade fundanestalee: | her Fisher a partir de 1912, una variable aleatoria en una poblacién, cuya | juncién de distfibucién es F(x; B,, By, ..., 8), que de- | ide de K parémetros, y sean: | , una variable aleatoria representativa del primer valor rmuestral ‘una variable aleatoria representativa del segundo va- Jor muestral 4, una variable aleatoria representativa del nsimo lor muestral La probabilidad de que estas variables estén conteni- das en el recinto de n dimensiones (6 8+ ARs Xp, Xp oH AGS 05 Hye My # dx) 8: Pls, <8) Sm + dy my < Be Sy + des... os

oo (6.72) + By) = oa; By, Bas +» By) ‘Asta funcién de densidad conjunta, producto de las juriones de densidad individuals, se Ia Hama funcién * Verosimilitud V. i ue indo valores convenientes de Pi se soneeguled nig Lt Probabilidad P sea maxima, Para hallar el méxi- ay Tespecto a las 8; se tienen las K ecuaciones av (3.73) Distribucione: je probebilidad La solucién del sistema de ecuaciones da los valores: Oy Nay oo = Bly, x, que son los parémetros buscados. Las funciones 8; son Jos estimadores. En algunas ocasiones, por el cardeter exponencial de 10%, Bry Bys -.. 94) puede ser més conveniente hallar el méximo de la’ funcién InV con Io que el sistema de ecuaciones seria: ainv ainv ainv 8, a8, a (3.74) Ejemplo 5 Hallar los estimadores méximo-verosimiles de Xa y ¢ en. tuna poblacién normal. La funcién de densidad de una distribuci6n normal es (558): ee ove La funcién de verosimilitud para n valores de la muestra es: 1035 Xm @) $005 Xap ©) + £0; my 9) + sells Xa) 0) = tomando logaritmos: 1s [x-xm¥ nve-am evn ( =) anv -le Sim-x=0 Axa et a gatelia’ ota Ei = x0 ae © sjsu Por to tanto: 3.38 Noctones de estadistica 2.4.2, Método de los momentos © de Pearson Consiste en igualar tantos momentos respecto al of {gen en la poblacin a los correspondientes momentos de In muestra, como parémetros haya que estimar, MG), Bi B= my = My, 8a) on) 8) =m = = MiB. Boy oy By) =m = 2 2 De donde obtenemos: Br = Bip Br = Bl, Xa B= Bult (3.75) Los estimadores 6, son, en general, distintos de los obtenidos en 2.4.1. o%) ») x) Bjemplo 6 Hillar los estimadores de xe y ¢ en una poblacién normal por el método de Pearson. ‘Al iguslar el primer momento se tiene: mak Al igualar el segundo: Si =m, 0 ea FH DET EE de donde: eas 2.4.3. Método de los minimos cuadrados Consiste en representar gréficamente los puntos de ta muestra y ajustar a esta nube de puntos una curva por minimos cuadrados. Suponiendo que los errores cometidos en el ajuste son ‘aleatorios. Si estos errores son 8, = Y curva ~ Y pun- tos, siendo Ia curva Y, = ox) la distribucién de la poblacién, que puede ser, por ejemplo del tipo eS ysad bx tor se tiene: 2 ap = @ + bx + ox — You cen encontrar Ios valores de, consis ea 5? sea minimo, ye para los cuales Para ello, se establecen las ecuaciones: ake 2a ab F ano8el Cs) ces una de las 3 ecuaciones a resolver. Nétese que st ‘ecuaciones linesles en a, b y c. En este método debe tenerse muy en cuenta ques deben redondearse las cifras, es decir, debe opeane siempre con todas las cifras significativas, de lo a trario pueden cometerse grandes errores. 24,4 Método grafico Consiste en representar los valores muesrales, a ellos una funcién de distribucién de 1a poblacién tipo al cual se supone pertensoe la muestra, y obit de la represenacion grafica dela funcion de dt bucién, los pardmetros que se desee estimar. El ajuste se puede realizar estimando 0, 1, 2 on! Parimetros de Ia poblaciGn en funcign de lee esil# ticos muestrales, es decir, con N—1, N—2, vn N-!—t Brads de Ubetad, lo cal influye al aplicar ©, o2->0 (fig. 3.17). Segundo postulado. Para un tamafio N de la mues tra, dado, cuanto més varian los valores de x alrededor de la media, més varfan los parémetros @ estimados, por lb que la precisiGn es menor. Es decir, la variacién de @ ‘ proporcional al cociente entre la variacién de x y fl tamafio de ta muestra N. ae On N Por lo tanto, ya que la variacién de x es inherente al fenémeno, solamente se puede actuar sobre N para que ‘daminuya la variacion de 2 Para obtener la distribucién de los parémetros se puc- de seguir un método tedrico 0 analitico, en cuyo ea80 Ia distri obtenida puede ser comprobada mediante Uwe generacién aleatoria de muestras. Veamos algunos ‘iemplos de este método tedrico: itu de la media muestral ‘ma poblacién normal Sa una poblacién normal (xq 9) de la que se extrac Imuestra de tamafio n: xy, Xp. «+» Xr La media ral sera Xp Xa tone tM roel: ine ait 7 mw Distribuciones de probsbilidad 3.3: Cada una de las observaciones x, puede considerarse como una variable aleatoria normal (¥q,). Las variables erin también normales (= ) ya que na se verifica que & 1 ®( ) = rg) = 2 7 2 o($) «bow a con una media y varianza: La suma serd también normal Es decir, la media muestral X de una poblacién nor- tiene una distribucién normal de media xq y des- vviaci6n tipica ¢/ Vn. Distribucién de ta varianza muestral de una poblacién normal Se demuestra (Suérez, 1966) que la variable nS?/¢? tiene ‘una distribucién 72 con n — 1 grados de libertad y que las variables X y S? son independientes. ‘Otro método consiste en ajustar a la distribucién de Jos pardmetros alguna de las distribuciones teérieas que ppor experiencia se sabe que pueden adoptar los pard- ‘metros estimados, tales como la distribucién normal, Ia distribucién ¥2 y la distribucién t de Student, 2.5 INTERVALOS DE CONFIANZA En el apartado 1.17.2 se han definido los intervalos de confianza. En el apartado anterior (2.4) se exponen 3.40 Nociones de estadistica algunos métodos de estimacién puntual de parémetros sin referencia a la confianza que merecen los resultados. Se conocen ademas las distribuciones en el muestreo de las estimaciones, de modo que pueden calcularse las medias, varianzas, etc., respectivas. Se trata ahora de la posibilidad de asignar dos Ifmites (intervalo) a un cierto pardmetro y afirmar que, con una cierta probabilidad ‘especificada (nivel de confianza), el yerdadero valor del pardmetro estar situado entre estos dos Iimites. Algu- NOS casos 50 Intervalo de confianza para la media de una poblacién normal (Xp, ) Hemos visto en 2.45 que la media muestral X de una PoblaciGn normal tiene una distribucién normal. (tay 2/Vn), mientras que la varianza nS*/c* tiene una distr bucién x2 con n — 1 grados de libertad. De acuerdo con 2.28 la variable tendré una distribucién de Student con n — 1 grados de libertad. Es decir, fijada una probabilidad o nivel de confianza C % se verificaré: Ha < EST 6 lo que es lo mismo: Pat, mq ck + n-1 tervalo de confianza X—t, que merece Ia estimacién Fa, ra 3.18), EI valor de t, en Ia tabla A.3.5 se halla para tiy_c, siendo C el nivel de confianza, para n— 1 grados de libertad. Ejemplo 7 De una poblacién normal se han observado los valores: a Wy 13, 150, 152, 155. Hallar uy 128, 136, 138, pens 15% de confianza, Mery, La me 129-4 136-+ 138-4 142+ 145-4 15041524155 ge 3 =i La desviacin tipiea (28 15) 036— 145). (155157 s=4|-———_> 3... oy 7 grads libertad es 235 BI valor de tos para 8 — (tabla A.3.3), con lo que: 810 vee 5 = 25652 = 274 y el intervalo de confianza al 95 96 seré (143 ~ 143 42,7 = 145,7 = (140,7, 145,7). Intervalo de confianza para la varianza de una poblacién normal (%q»2) Se vio en 2.4.5 que la variable nS*/? tiene une de tribucién 32 con n = 1 grados de libertad. Se veri! por Io tanto ast *(%< =") oe e 100 Kt, — Penis ie Froves 3.18 Intervalo setae de coninza para ta media normal, Fama 3.19 Inerselo de confianza para la varianza i we poblaciér normal. ber P = ce, = = 2 % e, 100 «ono que los valores de 1p. y 22, determinan el inter- tab de confianza ( Ya-S Va-S ) Ds % dela desviacién t{pica ¢ (fig. 3.19). Distribuciones de probabilidad 3.41 No es posible en este caso escoger un intervalo cen- trado. Lo que suele hacerse es determinar x2, y 2 tales que cada uno deje a su izquierda o derecha, respective. mente, la mitad del nivel de significacin. Por ejemplo si el nivel de confianza es el 95 9%, el nivel de signifi cacién es 0,05 y en este caso buscarfamos en las tablas Poms ¥ Pos.ors- Ejemplo 8 Hallar un intervalo de confianza del 90 9 para la varianza del ejemplo anterior. Los valores de ys y x'mmn son para 7 grados de liber- tad (tabla A3.4) Kosi 5 = 2I7 con lo que el intervalo para o* seré: 419 y para la desviacién tpiea ¢ serd: nae, as 610s ¥ x Capitulo 3.3 Correlacién y regresién 3.1 INTRODUCCION En la mayor parte de los estudios estadistcos se pre- senta el problema de predecir los valores que puede tomar una determinada variable. Es el problema de ta inferencia estadistica o estadistca inductiva, El plantea- siento del método de solucién puede realizarse de varias formas. Unas veces se trata de completar una serie de datos de la variable problema a partir de series de datos de una o més variables que estén relacionadas con aque- Ia de alguna manera, Otras veces se trata simplemente de conseguir un cierto conccimiento sobre los factores ‘gue influyen en el valor de le variable problema, con Gl fin de poder realizar hipétesis adecuadas sobre sus valores desconocidos. Estos aspecios son tralados por Ia regrsign y la corre- lacién, respectivamente. Es importante destacar el hecho de que Ia aplicacién de los méiodos de la correlacién Y regresién, no proporciona por si misma ninguna infor- TmaciGn del ipo eausaefecto, ya que los resultados expre- fan tinicamente relaciones numéricas entre las variables festudiadas. Sin embargo, a partir de estes relaciones se puede Ilegar a conclusiones de este tipo. Por tanto Ta finalided primordial de estos métodos es averiguar Jos grupos de variables que. deben estudiarse conjunta- ‘mente. En otras palabras, si se supone que una varia: ble x es influida por un conjunto de variables xy, X25.» Sy, el andlisis correlacional obtendré una serie de facto: ros que en resumen vendrén a expresar Ia proporcién de la varianza de x que debe atribuirse a cada una de fs variables x, De este modo se puede decidir el sub- conjunto de las variables que no influyen de forma Significativa en el valor de x (fig. 320). ‘La diferencia entre regresién y correlaci6n es muy clara. Un problema de regresién consider la distribucin e Trecuencias de una variable, o variable dependiente, ‘cuando otra otras variables, o variables independientes, se sopnen conocas Pr ote parte, un problems SECS Cerin vevntnconjnt dv rec coiquen rerrisiones a ninguna de di bles sina elacgnobtene el prado de etic Por nig wuben,repreventado muméscament pr T'Selicens de conc, mines go eee See ana coucton que permite calealr a acpeniente parr de a independiente. 3,2 REGRESION Y CORRELACION LINEAL Es la teorla que estudia la relacién lineal que exise centre dos variable, despreciando toda posible infeneis dde otras variables distinas. 3.2.1 Rectas de regresién Dado un conjunto de pares de valores correspanise tes a dos variables x e y, se define como recta de eg | OTs x Ficuna 5.20 Porcentaje de ta varianza total de x explicada por cit AEORENOW OF x sooneY sin de y sobre x a una recta tal que Ia suma de los, tauirados de las desviaciones de cada punto, en direc- Gin y, oon respecto a la recta es minima (fig. 3.21 areca de regresién de x sobre y se define de la misma smera, eungue considerando las desviaciones en direc- yor minimos cuadrados, ya que este método obtiene la curva tal que la suma de los cuadrados de la distancia de ceda punto de la muestra a dicha curva sea m{nima, carva que en la regresin lineal es una recta. En el caso dela regresin de y sobre x se considera x como varia- te independiente, y por tanto la recta obtenida se puede tnplear para completar series de valores de y partir e series equivalentes completas de x. Lo contrario ocu- een la regresin de x sobre y. iuyzeaie de reprsién 20 definen de Ia forma si- 4) Dey sobre x +bx G7) Ew gs Ton sari 5 ; (8 — “ N ‘= _{0varianza de (x, y) ee Varianza de x tay Lb lend: er j._Mimero de pares de valores }2Btia de ta muestra de x Media de la muestra de y (5.78) 6.79) Correlacién y regresién B) Dex sobre y xSevy 6.80) Gat) 6.82) Las dos rectas de regresién se cortan por tanto en el punto (x, 9). Algunas veces se emplea Ia Hamada recta de regresién cortogonal, en Ia que se toman las desviaciones perpen- dicularmente a la recta, La situacién relative de las tres rectas de regresién puede apreciarse en la figura 3.22. ‘Un punto que hay que destacar es que Ias ecuaciones indicadas corresponden a las rectas de regresién de la muestra, Las correspondientes a 1a poblacién, deben in- cluir una cantidad aleatoria que representa el error pro- dducido por el hecho de que las dos variables no estarén relacionadas necesariamente por una linea recta. Por ‘tra parte Ia pendiente y Is ordenada en el origen deben caleularse con Ia media, varianza y covarianza de la poblacién, Por tanto la ccuacién que debe emplearse a efectos de prediccién, tomando x como variable inde- pendiente, es In siguiente: yao+B+e G83) x x Figura 3.22 ién relativa de las rectas de regresién. 3.4 Nociones de Ficura 325 Intervalos de confianza en la regresién. EI valor de ¢, se puede calcular de Ia forma siguiente: 1, Célculo de % = yi—y para los valores de la muestra, donde y es ei valor te6rico deducido de la aplicacién de la ecuacién (3.83) sin incluir el término aleatorio para cada x;, 2. El estudio de Ia distribucién de «,. 3. Generacién de una serie aleatoria de valores ‘que sigan Ia distribuciSn obtenidla en 2 (ver apéndice A33.1.3). Estos valores se introducen sucesivamente en a ecuacién (5.85). A partir de los valores de ¢, obtenidos en 1 puede también calcularse el llamado error standard de estima- cién, que se define como la desviacién tipica de ¢. Para Ia regresién de y sobre x este error vale: 1s 1s [Oe Spey | SEG Ha on Sy wad Eg Gash puesto que la media de las desviaciones ¢, es nula, como puede comprobarse calculando la expresién: co E y-+ be G85) N La distribucién de ¢ se puede suponer normal en In mayorfa de los casos. Entonces, por definicién de distri- bucién normal, se cumpliré, para un N suficientemente grande, que trazando a ambos lados de la recta de regre- sién Ifneas paralelas a ella y a distancias Sq, 2 Sy y go ¥ 99,7 %. Ae 108 punog 3 Sy el 68.%, 95 cada par de lines, “hk 3 crea se encontrarén entre cada par de linea, «4 1a 3.23). 3.22 Coeficiente de correlacién iciente de correlacidn se puede definr ce een oeticiente de determinacion. Se lam ficiente de determinacién a la relacién que exis seitnza explicada por la curva teGrica ajustay yf wi Nanza total de Ia muestra. Esta definicion es para correlaciones no lineales. Coeficiente de coreg vdrada del coeficiente de determines, la raiz. cua r por tanto, su expresiOn matemética es: 6a) donde yj = valores te6ricos obtenidos mediante la recta o cm va de regresi6n. yi = valores de Ia muestra, Para una regresién lineal de y sobre x la {émule# transforma en: oo) ¥ por tanto, re VBP fe) por lo cual basta ie ttos rb y bY. mitcon salcular dos de tos tres pati Sy = (1 — ys2 oa De Ia definicién de coef inn ea defini oeficiente de determina deduce que, si todos los puntos de la muestra sti r | 1 dos, la correlacién es perfecta y toda la vatianza de serestra es explicada. En este caso el coeficiente de | Eiminacion vale 1, es decir, ef 100%, mientras. que ofp correlaciin vale 1. Si no existe correlacién Ie atta no explica ninguna proporcidn de la varianza total, Fins eceficientes de determinacién y correlacién serén ‘os. En otras palabras, los limites dl valor absolute ‘il eoeiciente de correlacién son 0 y 1, emplo 9 Corelacién y regresién lineal simple. Se dspone de los siguientes datos de aportacién y preck- sresin'ea una cuenea expresados en ‘porcentae’ de ies Fane reapectivas; Riggs (1968) v Orerando con estos valores resulta: Frys 192042 2x" = 189201 ¥ = 197375 Ui peniente de | : ne de Ja recta de regresién de y sobre X, por ‘formule (3.78) es: be So Bay N55 8° Tene Correlacién y regresi6n 3 vs20a - MOL 199 Seeconirnitie He tae veo - y la ordenada en el origen, segin (3.79), 1944 — 1,525 X 100,06 = 33,14 luego la recta de regresi6n de y sobre x es: y= 35516 + 1,525 Las varianzas centradas de x ¢ y son: 1808 189291 — Ex —N¥ N-1 7 534,76 1033,70 El error standard de estimacién, desarrollando (3.89) N=1_ ye us, ror Sr PSD = S. = 109 El coeficiente de correlacién, de (3:87) y (3.88) b 534,76 ea s 105570 Los datos y la recta de regresién se representan en la figura 3.24. Conocida la recta de regresin de y sobre x seria posible predecir los valores de las aportaciones correspondientes a tuna serie de precipitaciones. Esta serie puede ser medida, ‘como podria ocurrir en el caso de que la estacién de aforos hhubiera desaparecido en 1945 y se deseara completar 1a serie, También puede emplearse una serie supuesta de preci- pitaciones calculindose las aportaciones correspondientes a esa serie ideal. Hay que hacer notar que el coeficiente de correlacién es muy alto, 0,95, lo cual da una gran confianza a los valores caleulados. Esta confianza se refleja en el error standard de it oa aaEeanamnemmemimnmneimeeseeeaeeeeemae x 3.46 +] APORTACION ANUAL EN PORCENTAVE ELA MEDIA 8 3 36, 8 MO Oy [PRECIPITACION ANUAL EN PORCENTAJE DE LA MEDIA Ficura 3.24 Representacién grdjica de la muestra y la recta de regresién de y sobre x. cestimacién Sq, cuyo valor es 10,0. Esto quiere decir que si se considera que los errores estén distribuidof normalmen- te, se tiene un 68,27 % de probabilidad de que el valor real tenga un error de £1000 respecto al calculado, un 9545 % de que tenga +200 y un 99,75 % de que tenga 30,0 %, La razén es que el error standard es la desviacién tipica de 1a distribucién de los errores y segin las tablas de la dis- tribucién normal, las éreas comprendidas entre la media més ‘y menos una, dos o tres veces Ia desviscién tipica son las indicadas. 3.3 REGRESION Y CORRELACION NO LINEALES Los conceptos desarrollados en los apartados anterio- res son perfectamente aplicables al caso de que le rela- cién entre las variables sea no lineal. Debe tenerse en de una regresién lineal sea bajo, no implica la falta de relacién entre las variables. Puede darse el caso de que cexistan funciones no lineales que arrojen un buen coefi- ciente de correlacién, El yalor del coeficiente de correlacién es el expresado en la f6rmula (5.86) ya que como se dijo, es la rafz cus- % dead del cocente entre J varianza expla tal. , vatonzganto a 1a regresén no Tine se hab g crus de regresién de y sobre x y de x sobre 6,8 Strassen clr por nics cud, @ ‘métodos de tipo iterativo para la ui ue my adores, y otros basados en desarclos ent oF anva de regresin elegida. Otro método, de Cacién sencilla, consiste en elegir un sistema de fnadas tal que la funcién se transforma en una yy (W. T. Chow, 1964, cap. 8-11). 3.4 REGRESION Y CORRELACION MULTIPLE En general, puede hacerse 1a hipétesis de que la rrelacin para una determinada variable depending simple, esto es, que-s6lo hay tna variable indepen ‘que esté significativamente relacionada con aquell Sa embargo, puede haber casos en que esto no ocur entonces’ debe plantearse un problema de regres} correlacién miiltiple del tipo Y= M05 70, 8 os Be) om donde las variables independientes x1, X deben estar relacionadas entre sf. Para comprobars be ta calcular los coeficientes de correlacién ty ente dos variables x; y x, y comprobar que sus valor # difieren significativamente de cero. 1 relacién puede ser lineal, en cuyo caso se or minimos cuadrados el plano de regresiGn, © Ser no lineal, calculéndose entonces una supétlic Faresién. La eleccion del nimero de variables ite cy ™, es importante, no sélo porque al sue Tegente también la dificultad de cdlculo, sino Pt macién (ig nent? que se comienza a perder i pe 3.25), Esto se debe a que se puede cmt mode nee PAE Por todos los. punto, ¥ se llega wee oetiene ninguna informacién, A es f se llega cuando el nimero a ads Ne foal le puntos observados "hy fariables Se Puede indicar que ™ La dificultad 9/24! en lineal, ‘ wa tos pa intentar sacar conclusiones et metros complican log ae distribuidos normalm® eure 325 Varacién del coeficiente de correlacién en funcién {ol ndmero de variables independientes m. 35 TRATAMIENTO DE MUESTRAS INTERDEPENDIENTES Al hablar de funciones de distribucién se ha conside- rado impicitamente que los valores de una variable son independientes entre sf. Sin embargo es frecuente el caso de que en funciones relacionadas con el tiempo haya tt relacién entre los diversos valores. Por ejemplo, si tm verano se presenta seco, no debe esperarse que a un cnidl inferior a la media en el mes de julio, vaya a ‘equir un caudal muy superior a la media en el mes de ‘puto, Aunque esto pueda ocurrir, Ia probsbilidad es Correlacién y regresién Pequeiia, ya que hay una relacién entre los caudales de ambos meses. La expresién matemitica de esta rele cidn es el llamado coeficiente de correlacién serial. Se define como coefciente de correlacién serial de primero, segundo, etc., orden de una serie ordenada cronolégica- mente al coeficiente de correlacién obtenido al conside- rar los pares de puntos formados por cada valor y el situado Uno, dos, etc, intervalos de tiempo después. Si la muestra €8 xy, X .» Xa el coeficiente de corre- lacién serial de primer orden’ se obtendrfa con los n— 1 pares (515 ¥)s (ay Xs ORae Rs or nate) EI de segundo orden con los n — 2 pares (1X), Ca XD 3, BD vor aor) Y asi sucesivamente. Para poder aplicar las funciones te6ricas de distribu cin en la hipétesis de independencia es preciso com- probar que los coeficientes de correlacién serial no son significativamente distintos de cero. Por ejemplo, al ope- rar con aportaciones anuales de un rio, en general serén independientes. Sin embargo en el caso de que Ia cuenca tenga amplias zones permeables comunicedas hidréuli- camente con el ro, es probable que no pueda hacerse Ia hipétesis de independencia pues le inercia introducida por los aculferos dard lugar a una relacién entre cat ales anuales sucesivos. 3.47 Apéndice 3.1 Series cronolégicas A.3.1.1 Introduccién Un aspecto importante dentro de los estudios esta disticos de series hidrolégicas es el tratamiento de las series cronolégicas. Se define como serie cronolégica a ‘un conjunto de valores ordenados con respecto al tiem- PO, que puede definirse mediante una serie de paréme- tros estadisticos. Desde el punto de vista préctico las series cronolé- gicas pueden ser discretas, cuando provienen de una serie de medidas periédicas y continuas, cuando son el resultado de aparatos registradores de cardcter con- tinuo (fig. A3.1). Esta clasificacion no supone una limitacién, ya que ‘mediante un digitalizador se puede transformar una serie continua en discreta, y mediante un ordenador ana- I6gico, se puede pasar de discreta continua Esencialmente las series cronolégicas se dividen en dos categorias: Deterministas. Son las series cuyo valor en cualquier instante se puede determinar con certeza, Pueden ser x x0 ia 7 nae #2 Fioura AS. Tipos de series cronolégicas. periddicas, semiperiddicas o presentar tendencies o a fos bruscos. Estocdsticas. Sus valores en cualquier instante sh pueden definirse por una funcién de distribucién, decir, en términos de probabilidad. Estas pueden ser: Estacionarias y no estacionarias, segtin que sus vale res sean o no independientes del tiempo (estacioutit de primer orden). Si la media varianze y covariant dependen del tiempo son de segundo orden. Si los m@. mentos de orden n, no dependen del tiempo son ie cionarias de orden ‘n. Erg6dieas, si los valores de Ja serie convergen hi ‘un mismo valor. Un punto importante es observar que toda sere nol6gica de datos hidrolégicos consta de dos partes. de cllas es la componente aleatoria y Ia otra 1a de! nista. Intuitivamente, la. primera representa Ie ¥ lidad intrinseca a todo fenémeno natural, que de tal mémero de variables que st valor es aleatore segunda rene la parte previsible del valor del ¢ no. Mateméticamente la distincién es que Pentes aleatorias en el instante t y en el t+ DS eependientes, © sea que el coeficiente de cores fe cant orden n es significativa al ce 4s componente determinste ocurre le contr. _ HAY vatios mei cinco siguientes, A124, Autosoretsiin, ste ere e09 CO autoconelant®, 1S coeficientes de correleiot 'acién) de orden 1, 2, ..., k, se Pt " co 4 Frama AS2 onelograma. lconelograma, que es la gréfica de ta variacién de los eeficientes en funcién de su mimero de orden (ig A532). Series continuas dan correlogramas continuos, y series discretas,correlogramas discretos. La forma del corre: Jngama esti estrechamente ligade al cardcter de la seit. Si una serie es periédica su correlograma tam Ibe, pasando de +1 a —1 en un perfodo igual al de le seri, Una serie lineal da un correlograma lineal, y una serie de valores independientes da un correlograma «amo el dela figura A333. El correlograma de una serie, y por tanto Ia propia ‘st, puede reproducirse combinando varias funciones ‘ue responden a diferentes caracteriticas de Ja serie. Frm a3 ima de series de valores independientes. Series cronolégicas Por ejemplo, se puede combinar una funcién cilica con cierto niimero de arménicos y una funcin que re presenta la tendencia. Son estudios bastante complejos, Pues se trata no solo de reproducir una funcién com. plicads de decidir hasta que grado de precisién es conémicamente facible reproducila, en comparacién con la informacién obtenida, AS.122, Anilisis espectral. Es un método de ti ral estudio de Ja sutocorrelacién, y conectado estrechamente con éste. Se trata de estudiar llamado espectro de densidad, que es Ia relacién entre cada intervalo de frecuencias y la varianza explicada por dicho intervalo se cumple que el érea encerrada por la curva es igual a la varianza total. En el caso de series periédicas amort se presenta una serie de armé- nicos. Con el andlisis de varianza o densidad espectral se puede decidir, a un cierto nivel de confianza, cuales son los arménicos que influyen significativamente. Hay tuna relacién muy clara entre el correlograma y la densi- dad espectral de una serie (fig. A3.4). o Figura ASA Relacién entre correlograma y densidad especial. AS.1.25. Amplitud de variacién (Range). Consiste en el estudio de las desviaciones acumuladas con res- pecto a Ia media. De este modo se obtienen los déficits 6 excesos acumulados. Existe toda una teoria estadi dedicada a estudiar este fendmeno que resulta muy tn problemas de almacenamiento y regulacién de siste- ‘mas de recursos hidréulicos. A324, Conjuntos de caracteristicas parecidas (Runs). Es una teoria desarrollada para cl estudio 3.49 3.50 Nociones de estadistica de sistemas de recursos hidréulicos en que se estudia estadisticamente In aparicin de series secas o himedes. Se considera como variable este cardcter, es decir, trata de un periodo seco (inferior a a media), o himedo (superior a Ia media), sin entrar en demasiados detalles cuantitativos. A325. Anélisis de tendencias, Algunas series cronolégicas tienen sus propiedades enmascaradas por la existencia de una tendencia general a aumentar o dis- ‘minuir los valores observados. Si se consigue definir esta tendencia, se puede restar a cada valor observado el valor de aquella en el instante correspondiente, y ana- lizar con més facilided las caracteristicas de In serie. Un método muy empleado en el anélisis de tendencias es el de las medias méviles, cuya finalidad es suavizar In serie original mediante la sustitucién de cada valor 0 ponderada de varios valores adyacentes. 31 tiene, por valores %, Kay.» %q PUEGE realizarse el siguiente cambio de variables: bun + bats + bats v 3 1X2 + boxy + bay byXa-a + baka + Boke 3 que serfa un ejemplo de medias méviles de orden 5, debiéndose cumplir que b, +b; + bs = 3, y teniendo fen cuenta que la serie queda reducida en dos valores. Realizando tanteos con medias méviles de distinto orden, puede llegar a obtenerse la tendencia, a Ia que si es necesario puede asignarse una expresién matemé- 1, Chow (1964). A.3.1.3. Métodos de generacién de series ‘Los métodos de generacién de series consisten en Ia creacién de series sintéticas en las que se conservan ciertas caracterfsticas estadisticas de la muestra, Para ello hay que definir la ley que sigue Ia componente no aleatoria y afiadirle valores aleatorios con una deter- nada distribucién. La formulacién que expresa mate- m a operacién se suele Hamar modely sica del fenémeno. atorios hay que aque tienen ls prop méticamente est Ia serie cronoldg Para generar los valores ‘al uso de los niimeros aleatorios, dades siguientes: 1, Son independient es en secuencia, Para trorio hay que comprobar mediante un test 17. que Correlograma no es significativamente distinto de cen, 2, Su distribuci6n original es uniforme, aunque m, diante una transformacién se puede pasar a otra dit. bbucidn sin que por eso dejen de ser aleatorios, '5. Si para obtenerlos se usan las rutinas prepared para el empleo de ordenadores, hay que comprobar i Persistencia de su carécter aleatorio, ya que cuando shan generado 100 000 6 200 000 némeros, el ordenadr comienza a repetirlos y dejan de ser aleatorios. 4. Sus valores méximos y minimos deben ser sulk cientemente grandes y pequefios, ya que el ordenedx comete errores de truncadura Para obtenerlos pueden emplearse tablas de néimera alestorios publicadas (Rand Corporation: un millén de dmeros aleirios),rutines de ordenador, generat le ruidos aleatorios, etc. Fo samenimarson Fin a pF o Be» wo Foun, A535 Transjormacién de una serie E, de mimeros aleatoras Gon orbs anion ce S arme y comprendido 10 ota sere x con diibucon yn Fea enone Cor p ree ee" la figura, se trata: sencillamen'® " hullar el valor transformado’cuya, probabil

También podría gustarte