Está en la página 1de 74
LAS LEYES DEL AZAR Bartolo Luque Juan M. R. Parrondo eS Ss . } Descubrir la ciencia Materia j Lasleyer dj azar © Derive Luque y Juan Me Patron, 2018 (Ode eat edclor. EMSE EDAPP, SL, 2016, Resizacin edit: Sonat Aeampas, SL. ‘Deo ewsstracon de cuba: J, Mauncio Restropo (© Rawpul com) Shuterstoct ‘Dioatoy maquetacin: Kia Rira ‘© wstrcones: Jordi Dace (© Fologrtas: Tete as imégenies do este volumen son de domino pico exter {0 ls de as pigines 35 (amneerShuterstock) 36 jmsagesS.cgb £9), 57 (Ron Els! ‘Shutertoet, 153 (Schute GPLIWikimadia Commer). Depésiolegot 8 21176-2016 Iereaa en Arcangel Maggio ~ Division Litros i Lalayetie 1095. ‘Buinos ies, enol mos de febrero de 2017. ‘Reservados lodos fos derechos. Queca rgurasamente prohibida la odhcién total» parca de esta obra yor cuoiguer medio @ ‘rocedimiena yu dtntucién madiane equ opréstarropublicos. Las leyes del azar PROBABILIDAD, INFORMACION, ESTADISTICA Bartolo Luque Juan MR Parrondo CONTENIDO Introducelén Cémo pensar el azar Ruletas y coincidencias 1Qué es la probabilidad? Orgenesde eter delprobbidod Como pensar sobre el azar: el problema de Monty Hall iCudntas veces ganaré? Probabilidad y entropia te aseribucten biol Bl valor medio y la ley de los grandes nimeros La corps te Cae ‘Sorpresas, casualidades, milagros y otras probabitidades El problema del cumpleafios El principio de improbabilidad Probabilidad condicionadayy teorema de Bayes Teorema de la probablided tots: Cima determinar ‘udnte gent 2¢ droge o Gene un to Vagal o mal veto? la falacia del fiscal: la importancia de evaluar las probabilidades adecuadamente Elazar en movimiento: modelos Modelos y simulaciones Caminantes aleatorios Juegos parad6jtcos y motores moleculares a a 14 20 21 23 28 30 35 37 a7 40 43 47 48 583 53 55 Pregiintale a Google la importancia de Dios en la Biblia Fluctuaciones fatales Bits, palabras y adivinanzas Preguntas inteligentes eeutrea lnformacién suministra una pregenta? 3 Besdigode Hufnan Correlacionesy compresién de datos Complejided algorftmica La informacién en el lenguaje ‘Censos, encuestas y estimaciones 7 427 611 178 personas en un mundo en miniatura Ver os exoufoess Estimacién: contar sin contarlo tado un media maestro ex unestinodorisesgado La varienza muestrel esun etimador sesqads ‘pero podemos regi. El problema de los tanques alemanes ‘Amios estimaderes parecen razonables, ‘con cud nos quetamos? Intervalos de confianza De los datos a las ideas {Qué es una hipétesis estadistica? Valor p Correlaci6n no implica causalidad A modo de epilogo: abusos estadisticos Glosario 63 67 na 7 7 79 82 83 87 88 93 93 96 96 100 102 104 110 1m ur 117 122 126 136 148 Introduccién ‘Entre los 25 ylos 35 afios la probabilidad de quedarse embarazada de gemelos de forma natural se multiplica por cuatro». (EI Pals, 16 de mayo de 2016) 1a probabllidad de que un hombre en el paro encuentre empleo £8 del 16,4% frente al 12,6% de la mujer desempleada». (E! Mundo, 24 de mayo de 2016) «la actividad fisica regular disminuye en un 7% la probabilidad dle padecer cdncer en general. (ABC, 17 de mayo de 2016) En la actualidad es bastante facil encontrar afirmaciones como estas entre los deulares de periddicos o informativas de radio y te. {evislén. La probabiidad esta por todos lados. Casi nadie sabe muy bien qué es, pero aun asf posee una indudable capacidad de suscitar toda clase deemociones:tranquilidad cuando nos dicen que la ope. ‘acién a Iz que nos vamos a someter tiene un 99% de probabilidad de éxito; preceupacién si leemos que la probabitidad de una nueva Tecesién econbmica el préximo afio es «muy alta»; indi ignacion si nos {nteramos de que ls probabilidad de que auestro hijo sufra acoso escolar «podria disminuirs con cierta: s medidas que los. colegios se resisten aaplicar ete. Las tees del azar Be ‘Tenemos una nocién intuitiva de la probabilidad como «propen- sin» a que algo ocurra y una ligera idea de que las probabilidades cercanas al 100% son muy eltas, mientras que las probabitidades en torno al 50% son indicto de una situacién completamente aleatoria, Con esta imagen intuitiva, y con el prestigio que otorga a cualquier informacién aderezarla con datos numéricos y con clerto aroma a ciencia positiva, comunicadores y politicos utilizan la probabilidad y la estadfstica para lanzar toda clase de mensajes contundentes. Uno de los objetivos de este libro es precisamente servir de antidoto aesa tendencia: matizar la credibilidad de esos mensajes y proporcionar al lector herramientas suficientes para valorar en su justa medida cualquier afirmacién basada en la probabilidad o la estadistica. ‘A pesar de su actual popularidad, la teoria de la probabilidad es relativamente reciente. De hecho no fue considerada una rama «ho- norable» de las matematicas hasta los afios cuarenta del siglo pasa: do, Su utilizacién en las ciencias positivas es también tardia. Hasta el siglo x1X, matematicos y pensadores analizaron situaciones azarosas solo en relacién con juegos de cartasy dados. En aquella época, como consecuencia de la Revolucién Francesa y del auge de los estados-na- cién, se empezaron a aplicar cilculos probabilisticos de manera seria ‘a estad{sticas, a seguros y 2 algunos temas curiosos como la compo- ‘sicién de los jurados. Paralelamente, se desarrollé la estadistica para ‘analizar observaciones y mediciones experimentales en fisica y quk mica. En la segunda mitad del siglo xtg, los calculos probabilisticos comenzaron a aplicarse en fisica para describir el comportamlento de las moléculas de un gas. Pero no fue hasta el siglo xx que la probabilidad adquirié la re- levancta que presenta en la actualidad. A partir de los afos sesenta, précticamente ya no hubo ciencia alguna (fisica, quimica, biologia, eFonom(a, sociologia..) que no incorporase Ia probebilidad como he iesmienta basica de analisis. La probabilidad y el andlisis estadistico irrumpieron en todos los saberes cuantitativos y se convirtieron en elementos indispensables en la construccién de nuestra imagen del mundo, Para completar este escenario, en los afios cuarenta y cin- cuenta del sigio xx, el matemitico e ingeniero electrénico Claude ‘Shannon se dio cuenta de que la informacién que se transmitia en textos, mensajes, imagenes y sonido, se podia estudiar comosi provi- hiera de una fuente aleatoria. Con ello senté las bases de la teoria de la informacién, sin la cual habria sido imposible la posterior revolu- cién digital y de las telecomunicaciones. Lateoria de la probabilidad, ademas de ser crucial para entender el mundo contempordneo, es divertida. No ha perdido el vinculo con Jos juegos de azar y en muchas ocasiones desafia de manera. sorpren- dente nuestra intuicién, acostumbrada a un mundo determinista. Un libro sobre el azar necesariamente tenia que cubrir todos estos as- pectos: las sorpresas, las curiosidades, pero también las aplicaciones, la discusién conceptual acerca del significado dela probabilidad y los rudimentos matematicos de las distintas ciencias del azar. estaes la idea que nos ha guiado en la confeccién de este libro, En el capitulo 1 analizamos qué es la probabilidad, mostramos ‘que la mejor forma de pensar sobre el azar es imaginar muchas ré- plicas o repeticiones de un fenémeno aleatorio e introducimos con- eptos bésicos como el valor medio, el teorema central del limite Ja distribucién gaussiana, El capitulo 2 muestra una coleccién ee resultados curlosos e inesperados que ayudan a entender mejor el pauetecas i 1a probabilidad y nos permiten introducir algunos conceptos craclales, como las a i ecm probabilidades condicionadas y la in- Una de las aplicaciones més potentes de ta teo ial connor de nadernet tains ong sms legend ses aan beng el efco en una cada, et. Hoy prfedcamentecualguter prone i esl de rar Bg natural, industrial, soctal 0 econémico se puede estudiar constru- yendo un modelo que reproduzca su comportamtento, En el capftulo 3 estudiaremos algunos de estos modelos mas basicos: caminantes aleatorios y procesos de ramificacion, con aplicaciones algo hetero- dovas a la jerarquia de paginas web, de palabras en la Biblia o a la proliferacin de bacterias. El capitulo 4 est enteramente dedicadoa la teorfa de la informa- cién, y el Sy el 6 ala estadistica, En el capitulo 5 veremos cémo se realizan estimaciones sobre poblaciones a partir de pequefias mues- tras y c6mo encontrar el error de dichas estimactones. En el 6 anali- zaremos cémo ir «de los datos a las ideas», es decir, c6mo utilizar los datos estadisticos para validar o refutar modelos e hipétesis. En este {iltimo capitulo analizaremos también con qué facilidad se pueden encontrar correlaciones entre variables que no responden a ninguna relacién entre ellas y terminaremos con algunas advertencias sobre eluso actual de laestadistica. Después de este viaje, el lector tendré una panordmica del papel de la probabilidad y la estadistica en las nuevas teenologias y en la descripcién que la ciencia hace del mundo. Esta es sin duda motiva ‘cin suficiente para emprenderlo y completarlo. Pero hemos procu: ado también que cada etapa del viaje sea lo suficientemente curiosa y divertida como para que el lector disfrute del trayecto. Como pensar el azar teva dela probit en 0 erat cont gee notte kena astoa tae Perre-simon Laplace Ruletas y coincidencias la tarde del 14 de julio de 2000 Barney Vinson, un escritor espe- cializado en juegos de casino, se encontraba en el César Palace de Las Vegas, En una de las ruletas, cuenta Vinson, el ndmero siete salié cuatro veces seguidas. El jefe de seguridad del local le dijo a uno de sus compafieros: «Te apuesto un mill6n de délares 2 que no sale de nuevo», La apuesta no fue aceptada, pero el siete volvié a salir una quinta vez... y una sexta! Aquella tarde Vinson fue testigo de al due, segtin algunos aficionados a a ruleta, ha sido registrado en able seven a lo largo de toda la historia del juego: el 9 de julio de en el Hotel San Juan de Pu i guidas.en el niimero diez, Sp AE eee En un lanzamiento de ruleta la bola puede caer en cualquiera de los 37 nimeros que van del al 36.Sisuponemos que todos ellos lgualmente probables, la probablidad de que salga el niimero shee O cmguer ove a 1/37 fst clu Icaive na ee Las leyes Get onar Me ée probabilidad propuesta por el gran mateméy cle ies eS Uae (1749-1827) a princiine del sigh cee Ja probabiidad dem suceso A eselcociente - el niimero decasys fouorabls, aquels en los que se producirfa el 4850, y el nine ‘detodos ls casos posibles, Observemos que, masque una definicgn ge probabilidad, se trata de una regia para calcularla, De hecho, estamnes suponiendo a priorique todos los casos posibles son igualmente py. pables Por tanto, la regla de Laplace presupone en cierto modolane- cién de probabilidad o, al menos, bajo qué condiciones un conjuny de sucesos son igualmente probables. En la ruleta sustentamos esz ccreencia en su simetria circular; y en el caso de un dado, por ejemply, en su simetria cibica. La regla de Laplace para calcular probabilidades se puede aplicr fécilmente a dos lanzamientos de la ruleta. Si después de un lanze miento en que ha salido el nimero siete, lanzamos la bola de ruen, 2aué posibilidades hay de que salga otra vez. el niimero siete? Solr mente una. De modo que si nuestro evento A es «dos-sietes-segth | dos», el niimero de casos favorables es 1. ZY cudntos son posible’? | En la primera tirada tenfamos 37 posibilidades y, puesto queen | segunda también tenemos 37, el total de casos posibles o parejas nfimeros es 37 = 37, Estamos ahora en disposicién de calcular la probabilidad “—< j un niimero concreto, por ejemplo el diez, salga seis veces ee (Siempre que el crupier no haga ninguna trampa). Esta probabil al 5 1/(37 « 37 x 37 x 37 x37 x 37) = (1/37)*, aproximadamen® a Posibilidad entre 2500 millones. Observemos que, © sen uier secuencia de sets nameros, como por ejemplo la 31-32” 15, tiene exactamente la misma probabilidad de salir que ses * sels dieces seguidos. La ruleta no tiene memoria. En genersl Wt , suele suponer que la secuencia 10-10-10-10-10-10 es m8 FF. ble que la 31-3-10-27-7.15, porque la primera es «especi#” hemo pensar axar bes tras que la segunda tiene un aspecto anodino, Pero imaginese que la segunda secuencia esti formada por las fechas de nacimiento de sus dos hijos: el 31 de marzo de 2010 y el 27 de julio de 2015. Cree de verdad que la probabilidad de que aparezcan en la ruleta seis dieces seguidos es menor que la de que aparezcan de forma exacta y conse- cutiva las fechas en las que nacieron sus hijos? Sin embargo, la secuencia 10-10-10-10-10-10 s{ es especial en cierto sentido. Si en lugar de preguntarnos por secuencias concretas, nos preguntamos por el niimero de veces que aparece el diez en sets tiradas, entonces dicha secuenciaes la tinica en la que el diez aparece seis veces. Eso la hace bastante especial. Secuencias en las que el diez aparece cinco veces hay muchas. Por ejemplo; 10-10-31-10-10-10 o 7-10-10-10-10-10. Para que una secuencia de seis tiradas tenga exac- ‘tamente cinco dieces, uno cualquiera de los numeros de la secuencia Gene que ser distinto de diez. Bs decir, ese nimero puede ser cual- quiera de los 36 distintos de diez y puede aparecer en cualquiera de las sels posiciones de la secuencia, Por tanto, el nimero de secuen- cias de seis ndmeros con exactamente cinco dieces es 36 x 6 = 216, Se puede también calcular el niimero de secuencias con cuatro, tres, dos, uno o ningiin diez. Este ultimo caso, ningin-diez, esal que le co- Fresponden més secuencias, Hay 36* secuencias en las que no apare- ce ningin diez. Este nimero es, aproximadamente, dos mil millones, ‘Como todas tas secuencias son «equiprobables», es dos ‘mil millones de veces més probable que no aparezca ningun diez en seis tiradas, ‘que la aparicién de seis dieces seguidos. Pero recuerden que cada ‘secuencia concreta tiene la misma probabilidad. Lo que hace que el evento seis-dieces sea mucho mas Improbable que ningtin-diez, es ue hay dos mil millones de secuencias compatibles con el ditimo evento y solo una compatible con ol primero, Volveremos sobre este asunto al final de! capitulo. 4 nao —_ a —— LQué es la probabilidad? La nuleta, tirar un dadoo lanzar una moneda al aire son ejemplos cls- sicos para hablar de azar y de probabilidad. Pero, zqué significa exac- tamente «A es mas probable que B> o «la probabilidad de tal evento es del 40%»? La regla de Laplace, que se utiliz6 durante casi un siglo como definicién de probabilidad, pasa de puntillas por la cuestién. ‘Asigna a priori probabilidades por cuestiones de simetria y nos per- mite, a partir de ellas, avanzar en el cilculo de otras probabilidades mucho mas complejas. Sin embargo, poco nos dice sobre el significa- do tltimo de la probabilidad de un evento. Todavia hoy, después de ‘siglos de discusi6n, los matemsticos y filésofos siguen debatiendo la cuestién, De hecho, antes de la aparicién del problema sobre Ia interpreta~ cién de la probabilidad, ya existia una discusién previa sobre la dico- toma entre azar y determinismo, y también otra sobre una cuestion mucho més fundamental: si realmente existe o no el azar. La fisica ‘ddsica describfa toda la realidad fisica de forma determinista, sin de- far, Como decia el légico George Boole en el siglo xix: ela probabilidad es expectativa basada en un conocimiento parcial. Un conocimiento perfecto de todas las circunstancias que in- fluyen en un evento convertiria la expectativa en certezay no dejaria jugar a! necesidad para una teoria de probabilidades». Gracias al de- sayrollo de la mecénica cuéntica a principios del siglo xx se ha podi- do demostrar que Boole no estaba en lo cierto: el determinismo es incompatible con una descripcién local de la realidad fisica, es decit, esta practicamente aceptado que la naturaleza es intrinsecamente aleatoria Pero, incluso suponiendo que el azar no sea otra cosa més que desconocimiento de los detalles que rodean a un fenémeno, la inter pretacin de la probabilidad es problemstica, El matemitico Joseph jar espacio alguno al az ho pensar eer L, Doob (1910-2004) comentaba que «en 1933, para la mayoria de Jos matematicos, a probabilidad era alas mateméticas como el mer- cado negro es al mercado», Desde sus primeros escarceos con los Juegos en la época de! Renacimiento hasta comienzos del siglo Xx, la probabilidad fue una fuente de problemas y resultados interesantes. Pero su falta de rigor formal y las cuestiones de indole flloséfica y conceptual detrés del término «probabilidad la mantuvieron como tuna rama no del todo aceptada por la Matematica con maytisculas. Hoy la teoria de la probabilidad es una construccién matematica for- mal perfectamente coherente. En 1933, el matemético soviético An- drey Kolmogorov (1903-1997) establecié los axiomas o propledades bésicas que tienen que verificar eventos y probabilidades. Seguin Kol- mogorey, los eventos pueden combinarse de distintas formas dando lugar a nuevos eventos, de manera completamente andloga a como se combinan las proposiciones de la légica formal, Por ejemplo, de A += vaca-llover-mafiana y B = va-a-soplar-un-fuerte-viento-mafiana, se pueden obtener nuevos eventos: Ia negacién, no-A (mafiana no llove- +), la conjuncién A y B (mafiana llover4 y soplaré un fuerte viento) yla disyuncién Ao B (mafana lovers o soplaré un fuerte viento, © ‘ambas cosas ala vez). La probabilidad de un evento A es una funcién ue asocia un niimero, p(A), a dicho evento. Este niimero esté entre ceroy uno.’ Una «probabilidad nula» se asacia a un suceso imposible, ¥ «probabilidad uno» se asocia a un suceso seguro. La probabilidad tiene que verificar, ademas que, sidos eventos son incompatibles, es decir, sip(A y 8) = 0,entonces p(4 0 B) =p(A) + p(B).Con estas pro- Pledades tan simples se puede construir toda la teorfamatemStica d la probabilidad. * * tnmacas ocaslone también olarye de esterase esribela A) = 10. Por emo. demos decir ue proba osongida es 1/2 = 05 0d forma equbalente, del 50%, oan es iseliietaierteroe Lasleyes delazar 16 eo ‘sin embargo, esta teorfa matemética basada en axiomas no zan- ja la cuestién de cémo interpretar la probabilidad, es decir, de do- tar de significado al niimero p(A), puesto que no proporciona una definicién conceptual de probabilidad ni especifica su conexién con observaciones y experimentas. Es necesario, por tanto, un interpre- tacién de la teoria de la probabilidad. Hoy por hoy, la interpretacién més extendida es la lamada frecuentista, En esta interpretacién es necesario que el evento A sea uno de los posibles resultados de una accién o un xexperimento», por ejemplo, tirar un dado o una mo- eda, Si repetimos el experimento bajo las mismas condiciones un gran mimero de veces, observaremos A en, aproximadamente, una fraccién p(A) de las ocasiones. Es decir, si Nes el niimero de repeti- ciones del experimento, observaremos A en N x p(A) ocasiones. ES facil comprobar que los axiomas de Kolmogorov son compatibles con esta interpretacién. I primer problema de la interpretacién frecuentista es que s6lo es aplicable a experimentos que se pueden reproducir de forma idén- tica un gran ndmero de veces. Sin embargo, en ocasiones hablamos de la probabilidad de eventos tinicos, como cuando decimos que es probable que la causa della extincién de los dinosaurios fuera el im- pacto de un meteorite. O cuando el meteorélogo dice que mafana llo- verd con una probabilidad del 40%. El frecuentista puro diré que, en el primer caso, la afirmacién se trata unicamente de una forma de ha- blar: es fataz asignar una probabilidad concret, un nimero, al even- to meteorito-causa-la-extincién, cuando ni siquiera podemos enume- rar todas las posibles causas que podrfan hacer que los dinosaurios desaparecieran de la faz de la Tierra. En el segundo caso, segin el frecuentista radical, el meteorélogo quiere decir que, bajo las mis- mas circunstancias de presi6n, temperatura, movimiento de masas nubosas y otras variables que definen el estado de la atmésfera hoy, la evolucién de la misma es tal que, en un 40% de las ocasiones, daré leo pensar elazar a” lugar a Huvia mafiana. En realidad el «experimento» no esreproduct- ble, al menos no de forma practica, porque no podemos controlar las. condiciones atmosféricas. Podemos hacer algo de estadistica, pero Jas mismas condiciones atmosféricas no se van a repetir jamas de focna est uss ontdeney Capi le bes cal eaabIGs durante siglos o milenios, En realidad, el meteordlogo sf repite mu- ches yous tesperanecen perp Aachindlas ini eel ordenador de un modelo que reproduce bastante bien el movimien- to de las masas de aire y vapor de agua en la atmésfera y que est4 basado en ecuaciones que si han sido validadas por experimentos inprodicio cu aiskorsibx ler seater metonelognas satin nls fora alstovies a tases he cele peed de a cela son sorent. Tenones eumuce un erperomons {a simulacién, que puede repetirse muchas veces y as{ recuperar a viersiiislds Evcuedistr ote ION Selerre dace he ss qed tess puede caviascaes recto eens tanto, netamente frecuentista. . si En principio, la interpretacién frecuentista es muy razonable, ie discute que, si el experimento que da lugar a un evento pu- Dene oe las mismas condiciones una infinidad de veces, ea oo la que se observa el evento tender{a a acercarse Probabilidad cuando se aumenta el niimero de repeticiones, El Segundo problema de la interpretacién frecuentista es el signifi do ce «bajo las mismas condiciones». Cuando el médico nos dies ‘que cierto tratamiento tiene un 95% de éxito quiere decir qu : largo de muchas aplicaciones de dicho tratamiento, en el ee : casos se ha observado la curacién del paciente y en el 5% re: eid no se ha apreciado mejora alguna, Pero uno puede dudar, co) vag eae tier onto sem repeones dru epeinonectog condiciones, puesto que no hay dos individuos iguales, asteye det oar En medicina se intenta precisar mas este tipo de estadisticas mi- diendo las tasas de éxito en grupos homogéneos —varones de 40 afios, fumadores y con sobrepeso, por ejemplo—. El problema es que, cuantas mis caracterfsticas se ailaden, més reducido es el ni mero de casos y menos fiable es la tasa de éxito que se obtiene. La soluci6n es afladir sélo las caracteristicas relevantes para el éxito ‘oe fracaso del tratamiento. Pero esta no es tarea sencilla. :Cudles son las caracteristicas relevantes para la eficacia de una terapia 0 para el riesgo de una operacion? Podemos decir entonces que el frecuentista traslada el problema de la interpretacién de la probabilidad al problema, no més senci- lo, de decidir qué caracteristicas son relevantes para que un evento cocurra y cuales no, Por ello ha habido pensadores, matematices y fi- Iésofos que han tratado de ofrecer una interpretacién de la proba- bilidad mas amplia, basada en conceptos como «propensién», 0 que han aceptado que se trata de un concepto subjetivo que cuantifica nuestra ignorancia o nuestras expectativas ante un fendmeno alea- torio, No obstante, en este libro nos restringiremos, en la mayorfa de las ocasiones, a la interpretacién frecuentista, con la suposicion de que, al menos de forma ideal, los experimentos se pueden repe- tir una infinidad de veces bajo las mismas condiciones. Las ruletas, tos dados y las monedas son buenos candidatos. Constituyen expe rimentos muy sencillos en los que la aplicacin de la interpretacion frecuentista esta aparentemente exenta de los problemas que hemos mencionado. Decimos aparentemente porque, como afirmaba George Boole, el resultado del lanzamiento de una moneda puede predecirse ‘si uno conoce perfectamente la fuerza inicial con la que se lanza, las corrientes de aire, la rugosidad de la superficie sobre la que cae, et ‘Lo mismo, quiz en mayor medida, ocurre con la ruleta, cuyo resulta- do puede ser manipulado por un crupier experto. En cualquier caso podemos imaginar el lanzamiento «ideal» de una moneda como Ut ime pensar azar 19 ‘experimento que puede repetirse muchas veces bajo las mismas con- diciones y cuyo resultado es puramente aleatorio. No es de extrafiar ue el propio concepto de probabllidad surgiera histéricamente del anlisis de juegos de azar con dados y monedas, en los que la nocién de probabilidad, en su interpretacién frecuentista, aparece de forma natural y nos permite hacer predicciones no triviales. Por ejemplo, el cdlculo de probabilidades nos proporciona pode- rosas razones para dudar de la afirmacién con la que abriamos el capftulo: que sélo en dos ocasiones se ha observado aun mismo ni- ‘mero aparecer seis veces seguidas en la ruleta de un casino, Aunque la probabilidad de este evento es muy pequeiia —una entre 2500 mi- Nones—, hay muchas ruletas girando en el mundo, Pongamos que hay 2000 casinos en todo el planeta, una cifra bastante conservadora, cada uno con 10 ruletas con las que se juega unas 500 veces al dia (2100 por hora * 5 horas). Eso significa que, en un solo dia, se jue- 82 10 millones de veces. Por tanto, deberfamos observar el suceso ‘un-nimero-aparece-seis-veces-consecutivas una vez cada 250 dias, sproximadamente. Es dedi una vez cada aio o cada dos afos, mas 0 dina pedir ct Lururandea grtmarens we ccien afios. En un siglo, supontendo que los casinos abran s6l0 los ines de semana, las ruletas habrfan funcionado aproximadamente 100 aiios * 100 dfas por afio = 10 000 dias. El nimero total de lan. Zamir sat 100000 mllones Be de tendrames ue aber observado al suceso un-niimero-aparece-seis-veces-c unas 10!» 1/27} = 9 veces nce expose quel suceeo we ise street ie cesoco haya ocurrido alguna ver, cir ney aeareste nn en Origenes de la teorta de la probabilidad rere Simon Laplace escribia en su Théoria Anaitique dos Probabiltés (1812), «Es un hecho destacable que una cienca que empezé analizando Juegos de azar acebe convirendose en el més importante objeto del conc ‘mento huriano». Poco tiempo despues, | matemstica frencés Siméon Danis Poisson (1781-1840) en aus Rachorches aur le Probabilté (1897) corcrelaba més esa orien: «un probiema relatva a los juegos de azar, proouesto 2 un ‘auster janserista por un hombre de murdo, ha sido! erigen del calculo de probebildedess. EI austero jansenista no era otro que Blase Pascal (1623- 41662) y ol hortbre de mundo, Antoine Gembauld, Caballero de Mere. Ent siglo of Cabatloro do Maré, aficionado al juoge con loe dodos, planted el siguiente probleme a los matemicos Blaise Pascal y Ferra de Fermat (1601-1665): {Qué es més probable: (8) sacar i menos un 6 altar 4 veces un solo dado 0 (b) sacar un 12 en 24 tradas de 2 dasos? A pesar de co Peet een cn resent sete ine re delite sexual (i), acepté el rto. En el intercambo episiolar ue mentu- td Pascaly Fost poe ue’ ee prose a prt es bam aprobabiidad modema, se poms W pobetitid conplomerars pre ester ol probes 3d Cabaiiaro de Méré. Para e caso (a) enemas gus: P(ningin 6) =(5/ 6)" 1 uttzando la probetiidad complementai,Negames 8 P(almenos an 6)=1-(5/6)" =0,51 ‘Mientras queen ol cas0 (): . Paingi 12) =(35/ 36) ye nuevo, lizando la probabiidad complementaria (Ql menos un 12)~=1~ 35/36)" =0,49. ‘Sorprendontomenta, rao que sospechabs De Méré por pura expeion- ca. Fue Christiaen Huygens (1629-1695) quen,recogiondo y complatardo el trabajo de Pascal y Fermat, resento por primera vez en sociedad el calcula ‘de probablidades en su fibro De Ratocinis in Ludo Alege (1687). Habla ‘acid la teota de la prebabildad. lo pensar sor ee Cons Pensar sobre el azar: el problema de Monty Hal A pesar de los problemas que conlleva ineludiblemente la interpre- tacién freeuentista, la forma més clara e intuitiva de pensar sobre el azar y las probabilidades es imaginar muchas repeticiones del fen6- meno cuya probabilidad se quiere conocer. Un ejemplo que ilustrade forma contundente esta afirmacién es el famoso problema de Monty Hall, inspirado en el exitoso concurso Let's Make a Deal de los aos sesenta y setents, presentado por Monty Hall y Carol Merril en la te- levisién estadounidense, En la fase final del concurso, Monty ensefa tres cofres @ un su- frido concursante. En uno de ellos hay un gran premio y en los otros. dos hay una calabaza. El concursanteelige nervioso uno de los cofres, Monty aparta entonces el cofte elegido y mira lenta y teatralmente en el interior de los otros dos. Cierra de nuevo uno de ellos, toma el ‘tro con las dos manos y lo vuelca ante los ojos del concursante y el Publico, dejando caer la calabaza que haba en su interior. El concur- sante suspira aliviado, aunqueno tiene ninguna razén para ello. Mon- ‘ty, generoso, le ensefia los dos cofres que quedan cerrados yle ofrece '2 posibilidad de reconsiderar su decisién inicial: «Puedes ahora es- coger cualquiera de ellos», anuncia con un redoble de baterfa, Qué deberfa hacer el concursante? Mucha gente piensa que, una vez eliminado uno de los cofres, et Premio puede estar por igual en los dos que quedan. Por lo tanto, no importa el cofre que se elia: la probabilidad de ganar el premio es del 50%. Sia eso afiadimos que, en la mayorfa de las personas, modifi- ‘car una decisién correcta produce una sensacién de pérdida bastante ‘mas dolorosa que mantenerse en una incorrecta, no es de extrafar que casi todo el mundo se nlegue a cambiar de cofre. Hemos escenifi- ado el juego de Monty Hall en muchas ocasiones ante piiblicos rauy as lege dl ar a LLC istintosy cast todas los xconcursantes» han preferido quedarse con, elcofre elegidoen primer ugar. ‘sin embargo, lo mejor que puede hacer el concursante es cambiar ‘su decision inicial. Es facil convencerse de ello si pensamos no en un solo concurso sino en un gran nimero de ellos. Supongamos que el concursante tiene oportunidad de repetir el juego 600 veces, esdecir, imaginemos 600 réplicas del concurso, cada una con el premioen un cofre tomado al azar. Cuando el concursante elige por primera vez tuno de los tres cofres, es evidente que, aproximadamente, un tercio de las vecesacertard y dos tercios de las veces se equivocaré, Es deci, solamente en un tercio de las réplicas, unas 200, e1 premto estaré en el cofre elegido por el concursante. Monty descubre el cofre con la calabaza y quedan dos cofres cerrados. Recordemos que s6lo en un tercio de las réplicas el premio esta en el cofre elegido inicialmente. En elresto de las réplicas, el premioestaré en el otro cofre. Por tanto, si el concursante mantiene su decisién inicial, ganaré un tercio de las veces. Si cambia, ganaré dos tercios de las veces. Este ‘argumento se muestra en la figura 1, donde hemos dibujado séio 6 réplicas del juego. En términos de probabilidad, podemos decir que Ja probabilidad de ganar manteniendo la decisién inicial es un tercio, y la probabilidad de ganar si se cambia de cofre es de dos tercios. Los dos cofres no son equivalentes, como podria parecer a primera vista. Uno de ellos ha sido tomado al azar entre tres cofres en princi- pio iguales (con igual probabilidad de contener el premio). Elotro ha sido el superviviente de la inspeccién realizada por Monty Hall. Bs bastante dificil entender que la solucién correcta es cambiar de cofre si pensamos en una tinica realizacién del concurso, mientras que dicha solucién es casi trivial cuando se observan las réplicas de! concurso en la figura 1, Pero el problema de Monty Hall nos enses otro aspecto interesante acerca de la probabilidad y el azar. Al intro~ ‘ducir informacién acerca de un evento, cambian las probabilidades ino pensar ar 2 FIG. 4. Varlas repet cones del eoncursode ty Hal, EL cofre que tha elogidoInilalmente ef jugadorse encuentra en la ‘Stel jugador cambia de ‘ofr, tas probabilidades de siros eventos relicionados. La teort dela probabildad dispo- ne de herramientas muy potentes para analizar las relaciones entre ‘eventos aleatorios: las probabilidades condicionadas, que analizare- ‘mos en el siguiente capitulo, éCuantas veces ganaré? Probabilidad y entropia Larepeticién de un experimento es crucial para la interpretacién fre« cuentista de la probabilidad. Al principio del capftulo nos hemos en- frentado a este tipo de repeticiones en la ruleta y hemos encontrado algo a primera vista sorprendente: la ruleta no tiene memoria tanto, todos los niimeros tienen la misma probabilidad de sur ine. Lasleyes delaxar me pendtentemente de los resultados anteriores. :Cémo es posible que, fespués de muchas repeticiones, la frecuencia de aparicién de cada nimero se acerque a la probabilidad, como afirma la interpretacién frecuentista? La respuesta a esta pregunta tiene mucho que ver con algunas cuestiones fundamentales no s6lo de la teorfa de la probabi- Jidad, sino también de la fisica. Como vimos al principio de este primer capftulo, si nos pregunta- mos por el nimero de dieces en seis tiradas consecutivas,lo més pro- bable es que no aparezca ninguno, debido a que hay muchas secuen- dias sin ningiin diez, mientras que sélo hay una secuencia con seis dieces. Este ejemplo muestra claramente la diferencia entre las pro- babilidades de secuencias concretas y las de tipos de secuencias, es decir, conjuntos de secuencias que se ajustan a un cierto criterlo, La probabilidad de cada secuencia concreta ‘es siempre la misma, mien- tras que las probabilidades de tipos de secuencias pueden ser muy diferentes. En nuestro ejemplo, el tipo de secuencia salir-seis-veces- el-diez-en-sels-tiradas es 2000 millones dé veces més improbable que el tipo de secuencia no-salir-el-diez-en-seis-tiradas. La probabi- idad de un tipo de secuencia se calcula de forma muy sencilla, Basta multiplicar la probabilidad de una secuencia concreta por el nimero de secuencias de dicho tipo. Esta distincién entre secuencias concretas y tipos de secuencia, y el modo en que se calculan las probabilidades de cada tipo, es la base de uno de los conceptos mas profundos y relevantes de la fisica mo- derna: la entropfa, Para analizarlo en detalle utilizaremos un ejemplo més sencillo, y mAs relevante, que el de laruleta. Supongamos que lan- zamos una moneda al aire 100 veces. En esta ocasién la moneda esté trucada, de modo que la probabilidad de que salga cara es p= 045 y la de que salga cruzes \~p =0,55. Cual es la probabilidad de obte- ner n caras y 100-n cruces? En este caso, las secuencias concretas NO son igualmente probables, puesto que es més probable la cruz que a se a oa] ° o Numero de tiradas 1.2 Laure dann negra ligula ena prbaitnd de ue apa ‘ese na secenca coer con ncaa ra 100 acs mana segue con Probe decare 045 cru ,53 La cura gs mest el nmeede ecu con tarasy 100-rerxes La cara ners cent e elcent Ia rotablad de cbse ‘rm caraen lr 100 lnsamieyton La xa vores ereoponds eames cura tears conta lotr dor curvaretan reer pre uel comparctn ‘cara. La probabitidad de sacar, por ejemplo, dos caras en dos tiradas 50,45 x 0,45. Como las probabilidades se multiplican, por ser las ti- radas eventos independientes, la probabilidad de una secuencia con- creta que contenga n caras y 100-n cruces es: P{n) = 0,45* x 0,55100 . Elresultado de esta férmula es la curva discontinua negra de la figura 2, donde enfrentamos el ntimero de cruces na su probabilidad re-es- calada convenientemente —es decir, multiplicada por una constante— ara poder compararla posteriormente. Como vemos en la figura, la secuencia concreta mis probable es a de 0 carasy 100 cruces. A partir de ella, las probabilidades se van reduciendo a medida que disminuye ‘el ntimero de eruces y aumenta el néimero de caras. Aunque parezca increfble, si tuviéramos que apostar por una secuencia concreta entre las 2° 1,3 «10™ posibles secuencias, lo mésinteligente serta apostar ala de 100 cruces seguidas. osteyes detazor embargo, todo cambia si consideramos tipos de secuencias, Secuencias con 0 caras y 100 cruces sélo hay una. Tenemos, sin em- ‘argo, 100 secuencias con una cara y 99 cruces. Con dos caras y $8 cruces, hay ya 4950 posibilidades y, con 50 caras y $0 cruces, hay més de 10® posibilidades, un nimero extraordinariamente grande, En la figura 2, también con una escala adecuada para que puedan compararse todas con claridad, hemos dibujado en gris e! numero de posibilidades para cada tipo de secuencia. Finalmente, la probabilidad de cada tipo es el producto de la pro- babilidad de la secuencia y del nimero de posibilidades, y el resulta- do es la curva continua negra en la figura 2. Esta curva tiene su maxt- ‘mo enn=45,en completo acuerdocon lainterpretacién frecuentista: puesto que la probabilidad de que salga cara es 0,45, en un numero grande de tiradas deberdn salir un 45% de caras yun 55% de cruces. Lo interesante es que las secuencias concretas que constan de 45 ca rasy $5 cruces son mucho menos probables que lasecuencia con 100 ‘cruces, como se ve en la curva discontinua negra. La probabilidad de cada tipo, es decir, la curva continua negra, es el resultado de la com- binacién de las otras dos curvas, y se denomina distribucion binomial (véase el recuadro «La distribucién binomial», en ia pag. 28). ‘A finales del siglo xx, el fisico austriaco Ludwig Boltzmann utiliz6 esta combinacién para resolver unode los enigmas mas profundos dela fisica: conciliar el comportamiento del mundo macroscépico (el mundo ‘que podemos observar a simple vista) con las leyes que rigen el mundo microscépico de los atomos y las moléculas. Cada uno de estos mun- dos se comporta de manera diferente: en el microsc6pico el movimien- to no cesa, no hay friccién, la enerefa no se plerde, no hay una flecha del tiempo que distinga el pasado del futuro; en el macrosc6pico, !os cuerpos sufren fuerzas de friccién y tienden a pararse, la energfa se di sipa en forma de calor inutilizable y hay infinidad de procesos irrever- sibles, como cuando se hace afiicos una copa de cristal al caer al suelo. ino pense ar 2 Boltzmann se dio cuenta de que la diferencia entre el mundo mi- eroscépico y el macrosc6pico era en realidad una diferencia «de mi radan, y que esa diferencia, aunque muy simple y sutil, pod{a explicar los distintos comportamlentos de cada uno de los mundos. Cuando miramos el mundo microscopico vemos el movimiento detallado de cade particule, mientras que cuando miramos el mundo macroscépi- ‘c9 s6lo vemos los comportamientas colectivos, igual que a un politico no le interesa realmente saber la identidad de todos y cada uno de sus votantes, sino s6lo si el nimero total le permitira sentarse en un sillén del parlamento, Cuando decimos «mirar», no nos referimos ‘inicamente a observar o realizar medidas en et mundo maicrosc6pico ‘o macroscépico, sino también a las descripciones tedricas que hace~ mos de cada uno de ellos. Estos dos tipos de «mirada» se dan también en nuestro ejemplo de las secuencias. A un jugador que apueste en cada una de las 100 tiradas le importa cmo cae la moneda en cata una de ellas, es decir la secuencia concreta de resultados. Este seria un jugador «microscépi- co». Por el contrario, un jugador «macrosc6pico» seria el que apostara al mimero total de caras de toda la serie, y estaria s6lo interesado en cudntas caras salen en las 100 tiradas, es decir, en el tipo de secuencia, En un sistema fisico, Hamamos «estados microscépicos» a las secuen- Gas concretas y «estadas macroscépicos» a los tipos de secuencias. La probabilidad de que se dé un estado microscépico es mayor cuanto menor es su energia. Pero esta es la probabilidad de un es- tado microscépico concreto, igual que la curva discontinua negra de la figura 2 es la probabllidad de una secuencia concreta. Al pasar al mundo macroscépico las cosas cambian radicalmente; igual que en el ejemplo de La moneda, las provabitidades de les tipos de secuen- cia difieren mucho de las probabilidades de las secuencias concretas. Esto es debido a que también un estado macroscé6pico puede darse ‘en forma de un gran niimero de estados microscépicos. En un siste- La distribucién binomial Le probiatilided de 10s tos de secuancia que se explican gn el texto se deniomina distibucion binomial, Més concretamente, 0 ls probatiided pln) {e oblones mn caras y Nn cruces a lanzar N veces una moneda en la que la ‘probablidad de que selga cara esp. La formula dela dstnbucion binomial es: pine (*) gtr Tiesto teoa amie pennies (") elite ima onbinonepetdo oe fo osc do tar ea aera yo pee rn oe Mo?ndedn_2M Brower cata ']arcndmne se moun era onc ety ati, ha wk aya gous ne enalvsny ue csp ore poi figura 2. Ei segundo factor, pitl-p)" es la probabilidad de que aparezca eT ath Sates Onn ean ee ee el eeocgenupace een nce ib arta tpn ic a negra dela figura 2. ; La distribucién binomial eparece cuando estamos interesades en el nu- Pa panera pavers le ee eamaeasiitaten mince Scaual Sccrainiaoe sewes saumuausc cn Katarn & paaad a gtae cineen ae orc pomen See tel inima Siu pammerenae ony Peete pedrmgeomaci er seem ma fisico, el equivalente a la curva gris de la figura 2 es el nimero de estados microscépicos compatibles con un estado macroscopico dado, Boltzmann demostré que la entropfa (una magnitud que habla no pensar et aor 20 ——_— aparecido a mediados del siglo wrx al estudiar gases y motores tér- rmicos pero cuya naturaleza era afin misteriosa) estaba relacionada con ese niimero de estados microscépicos compatibles, fn concreto, la entropfa es proporcional al logaritmo de dicho nimero y la impor- tancia de esta relacl6n matematica es tal que se encuentra grabada ‘sobre la tumba del propio Boltzmann en el cementeria de Viena? Pensemos, por ejemplo, en un gas conte- nido en un recipiente que esta dividido en dos recintos por una pared permeable, tal y como se muestra en la figura 3. Como la caja esta apoyada en el suelo, la energia de las moléculas es menorenel recinto inferior porque su energia potencial gravitatoria es menor mientras mas cerca se esté del cen- tro de la Tierra. Por lo tanto, cada molécula «preferira> estar en el recinto inferior igual que, con nuestra moneda trucada, cada tira- PIG. 3 :Céme se distribu da «preferia» ser cruz en lugar de cara, Sin Yes as molécuas de un embargo, en una observacién macroscépi- SY isranec tere vog €2 no estamos interesados en ol comporta- recintos dl mismotamae miento de cada una de las moléculas sino Sélo en el comportamiento colectivo, que en Sr riedelyan dns este caso es la fraccién de molGculas que es- mis probubilided ée estar tén en cada recinto, Bl problema del gas es Sore Des entonces idéntico al problema delamoneda tunis clonadonacees: ¥. de la misma manera que lo hicimos con pi mas robablees aque las 100 tiradas, se puede demostrar que en ene! que una fraccion el estado macroscépico mas probable habra *P*°cablede moléculas se encientra enelrecinto luna fraccién apreciable de moléculas en el superior. fio,en el inferior laenergt ‘esmenor.Cadauna de las * El capitule¢veremos una genet de lnodin de entopl debids 2 Cade Shanon y silabeacuaiuler ania ser ‘Las ayes de! azar recinto superior, El valor concreto de esta fraccién es el resultado de la combinacion de un factor energético y de un factor entrépico, que son los andlogos a la curva discontinua negra y a la curva gris, dela figura 2, respectivamente. Cuanto menos pesadas son las mo- Iéculas y cuanto mas calientes estan, mas importante es el factor entr6pico y, por tanto, tienden a estar repartidas por igual en los dos recintos. Si no fuera por el factor entrépico, el estado mas pro- bable seria aquel en el que todas las moléculas estén en el recinto inferior, con la minima energia posible, De hecho, asi ocurre cuando la temperatura es-273‘C. Sino fuera por la entropfa, las moléculas que componen el aire que respiramos se precipitarian al suelo. La entropfa también explica por qué moléculas muy ligeras, como las de hidrégeno, no pueden ser retenidas por el campo gravitatorio terrestre y formar parte de la composicién del aire. Algo que no ocurre en planetzs con mayor gravedad, como Jipiter. La Luna, con su débil campo gravitatorio, apenas puede mantener ninguna mo- lécula gaseosa y por eso su atmésfera es practicamente inexistente, Es sorprendente cémo la probabilidad, la entropia y unos célculos combinatorios sencillos pueden arrojar informacién de lo que ocu- tre en las atm6sferas de planetas lejanos. El valor medio y Ia ley de los grandes niimeros Con el ejemplo anterior y la distribucién binomial hemos visto que la interpretaci6n frecuentista es consistente con el célculo de pro- babilidades, Si lanzamos muchas veces una moneda en la que la probabilidad de que salga cara es 0,45, el némero de caras es alea torio pero muy cercano al 45%. La generalizacién de este resultado constituye el llamado teorema central del limite, uno de los resulta- dos mas importantes de la teorfa de la probabilidad y fundamento de gran parte de la estadistica, como veremos en los capitulos Sy & m0 penser ear ” Para explicar el teorema central del limite, necesitamos introdu- cir un nuevo concepto basico en la teoria dela probabilidad: el valor medio de una cantidad aleatoria. El valor medio se obtiene sumando todos los posibles valores que toma la cantidad multiplicados por su probabilidad respectiva. Es el parémetro que nos da mds informacion acerca de una cantidad aleatoria. De hecho, en la mayorta de las oca~ slones una cantidad aleatoria puede visualizarse como una variable que fluctia en torno a su valor medio. El segundo parimetro impor- tante para caracterizar la cantidad aleatoriaes la dispersi6n 0 desvia- clén tipica, que se suele denotar con la letra griega o'y que nos indica la magnitud de dichas fluctuaciones. También se utiliza su cuadrado o? que se denomina varianza o dispersién cuadrética. En probabilidad y estadistica es necesario distinguir culdadosa- ‘mente entre el valor medio de una cantidad aleatorla y la media de una serie de datos. Esta Ultima suele denominarse media empfrica, Para enfatizar que se calcula a partir de un conjunto de datos obte- nidos empiricamente. Por el contrario, et valor medio de una canti- dad aleatoria es un concepto completamente tedrico que se obtiene a Partir de las probabilidades de que dicha cantidad tome valores con- cretos. Por ejemplo, el valor medio dela puntuacién obtenida al tirar tun dado no sesgado es (1+24+3+4+5 +6)/6=3,5 porque cada uno de los seis resultados posibles se obtiene con la misma probabilidad, 1/6. Sin embargo, si tiramos el dado diez veces, por eJemplo, pode- mos obtener la secuencia: 2, 1,4, 1,5, 3,3, 1, 6,5. La media de todas estas tiradas es (2+ 1+ 4+145+3+341+6+5)/10=3,1, queno iene por qué coincidir con el valor medio. Por supuesto, al aumen- tar el niimero de tiradas, la media de los resultados se acercaré cada ‘vez mas al valor medio 3,5 como consecuencia de la interpretacién frecuentista de la probabilidad, En efecto, tras un gran mimeroN de Uradas, cada cara del dado habré salido, aproximadamente, N/6 ve~ es. La media de las tiradas seré, aproximadamente: x az lyse ar hme pence al exar 2 (N16) +2(N /6)43(N /6)+4(N /6)+ SIN 16)46 0 15) W 35 Obsérvese que el ntimero N se cancela en ta fracciény lo que que- da es el valor medio. El mismo argumento se puede aplicar a cual- ‘quier cantidad aleatoria X que tome valores x,,x, X, con probabilidad P(x,) P(x.) ple), ete. El valor medio de la cantidad es: pn pC) +p 66)4 5,08) 4" ‘Tras un gran niimero N de experimentos en donde obtenemos va- lores de Ja cantidad aleatoria, cada posible resultado x habra salido, aproximadamente, Np(x) veces. Para calcular la media empirica te- nemos que dividir entre N la suma de todos los resultados; este nii- mero N se cancela, con lo cual la contribucién de cada resultado a la media empirica es, aproximadamente, xp(x). Asi, volvemos a obtener que la media empfrica m de una serie de datos obtenida mediante realizaciones de la cantidad aleatoria X se acercar4 al valor medio 4, tun resultado estrechamente relacionado (de hecho, equivalente) ‘con la consistencia de la interpretaci6n frecuentista. Pero zcomo se acerca la media empirica al valor medio? El teorema central del limi- te responde a esta pregunta y la respuesta es sorprendente por su universalidad: la mediam es una cantidad aleatoria cuya distribucion de probabilidad es, aproximadamente, la famosa campana de Gauss. La campana de Gauss, también conocida como gaussiana o distribu. cién normal, es una distribucién de probabilidad que responde a.una formula matemética muy concreta (véase el recuadro «La campana de Gauss», en la pag. 35). Su grafica es muy conocida: tiene la forma de una campana centrada en el valor medio de la distribuci6n y cuy? anchura es igual a su dispersién. Formulemos el teorema con mas precision, Consideremos la suma Va Xe s Xeno dy en donde X,, X,.%,y-"5X, son cantidades aleatorias idependientes y con Ja misma distribucién de probabilidad, Una hipétesis crucial para ¢elteorema es que tanto el valor medio y como la dispersién de esa dis- tribuciéa deben de ser cantidades finitas. El teorema dice que, cuando Nes muy grande, la distribucién de ¥ es gaussiana con valor medio iN ydispersién o¥/N . Es sorprendente la universalidad del resultado: 1a distribucion de ¥ es gaussiana Independientemente de como sean las cantidades X,, X,,X,--Xy. Puede que tomen sélo dos valores, 0 y 1, ‘con probabilidad p y 1-p respectivamente; o pueden ser el resultado de turadas de un dado; o pueden tomar valores continuos entre -100y 100. Nada de eso importa: cuando sumamos muchas de esas cantidades in- dependientes el resultado esté descrito por una campana de Gauss, Pero también es de gran importancia el hecho de que el valor me- dio y la dispersin de la suma dependan de N de forma diferente: ef Primero es proporcional aN y la segunda proporcional a VV. Esta diferencia es cructal para que la teorfa de la probabilidad sea dtil en Ja vida real y para fundamentar la Interpretacién frecuentista, Para convencernos de ello consideremos la cantidad ma Xit ht hypo hy N que no es otra cosa que la media empfrica de nuestras cantidades alea- torias.Elteorema central dellimite nos dice también que mes gaussiana cuando W esgrende, peroen este caso el valor medio seré wy dispersién @/ JW . Bs decir, m esuna cantidad aleatoria que fluctia en torno al va- Jor medio 4 pero esas Nuctuaclones se hacen cada ver més pequefias, Pensemos, por ejemplo, en los lanzamientos de una moneda justa (50% de probabitidades de salir cara o cruz). Si X, €s 1 si sale cara ‘Las \eyes del azar en el primer lanzamiento y 0 si sale cruz, y asf sucesivamente para X,, Xy ete, entonces la sums ¥ definida més arriba serd el ntimero total de carasy m la fracci6n de caras en N lanzamientos. El teorema central del Ifmite nos dice que dicha fraccién m es una cantidad que fucida en torno al 0,5 (que es el valor medio de %,) y que el tama- ‘no de esas fluctuaciones es 1/N aproximadamente, En la imagen siguiente vemos el resultado para N = 10, 20, 30, 40, 60 y 100 Lan- zamientos. Hemos marcado con puntos més gruesos las probabili- dades comprendidas entre 0,45 y 0,55. Vernos que a medida que N 025; ons: “ al i. est ul | I, 014 Fp 0.12F aaa q 3 a oth ml = Hh * all lh . se f ih. J OF paso 0.00 F 00 oo ow ft stall. a ih a © 02 o4 06 08 4 ° 4 06 of Como pensar elazer co erece la distribucién se concentra més y mds alrededor de 0,5 y el porcentaje de area correspondiente al intervalo (0,45, 0,55) se hace nds y més grande. Si lanzéramos la moneda diez mil veces, espera mos que m se aleje de su valor esperado como maximo en una canti- dad 1/ 10000 «0,01. es decir, que se encuentre entre 0,49 y 0,51. En cambio, sila lanzamosun millén deveces, el tamaio de la fluctuacion seré 1/-1000000 = 0,001 y lo esperable serfa que m se encontrara en- tre 0,499 y 0,501. Esto que acabamos de ilustrar se conoce como la ey de los grandes niimeros, yse utiliza constantemente en estadistica para estimarel error de encuestas y experimentos cientificos. La campana de Gauss te SoS ee eee ee es rr Utes on ceca ae areca ee ce Loe ee eee per emerges cgpeinager yop oon ia Ss per cece eae ae Se soe oe na ore ee era ey Soot acrletyaneaak aadinm nasal sees sf \ OT Su gréica ee une compane simésica respedo al valor medo que se ‘achota mas y mas con la varianza, Poderios interpreter a medie como un factor da trslacén y fa desvacin tpica 0 (iz cusdreca do la vavinza) ‘Pom un factor de escala del grado de diepersion. Obvervando les gréficas Bera la binomial y ta normal, nos demos cuenta desu extreordinerio parecido. De hecho, puede demostrares que cuando Nes grande y p pequetia en at

También podría gustarte