Está en la página 1de 30

DISTRIBUCIONES DE PROBABILIDAD

NDICE DISTRIBUCIONES DE PROBABILIDAD........................................................ 3 CLCULO DE PROBABILIDADES.................................................................................... 3 Conceptos generales............................................................................................................3 DISTRIBUCIONES DISCRETAS......................................................................................... 4 Distri !ci"n Uni#or$e %iscreta &a' (.................................................................................. 4 Distri !ci"n Bino$ial &n'p(................................................................................................ ) Distri !ci"n *ipergeo$+trica &N'R'n(................................................................................, Distri !ci"n -eo$+trica &p(............................................................................................... . Distri !ci"n Bino$ial negati/a &r'p(.................................................................................. 0 Distri !ci"n Poisson &la$ %a(..........................................................................................12 DISTRIBUCIONES CONTINUAS......................................................................................13 Distri !ci"n Uni#or$e &a' (..............................................................................................13 Distri !ci"n Nor$al &4!' Sig$a(.................................................................................... 14 Distri !ci"n Lognor$al &4!' Sig$a(.............................................................................. 1, Distri !ci"n Log5stica &a' (............................................................................................. 1. Distri !ci"n Beta &p'6(......................................................................................................10 Distri !ci"n -a$$a &a'p(.................................................................................................17 Distri !ci"n E8ponencial &la$ %a(.................................................................................. 31 Distri !ci"n 9i:c!a%ra%o &n(............................................................................................. 33 Distri !ci"n t %e St!%ent &n(.............................................................................................33 Distri !ci"n ; %e Sne%ecor &n'$(..................................................................................... 34 -ENERACI<N DE DISTRIBUCIONES............................................................................ 3, Conceptos generales..........................................................................................................3, DISTRIBUCIONES DISCRETAS....................................................................................... 3, Distri !ci"n 4!ltino$ial..................................................................................................3. DISTRIBUCIONES CONTINUAS......................................................................................3. Distri !ci"n Nor$al i/ariante........................................................................................ 30 BIBLIO-RA;=A.................................................................................................................. 37

DISTRIBUCIONES DE PROBABILIDAD
CLCULO DE PROBABILIDADES Conceptos generales
Uno de los objetivos de la estadstica es el conocimiento cuantitativo de una determinada parcela de la realidad. Para ello, es necesario construir un modelo de esta realidad particular objeto de estudio, partiendo de la premisa de que lo real es siempre ms complejo y multiforme que cualquier modelo que se pueda construir. De todas formas, la formulacin de modelos aceptados por las instituciones responsables y por los usuarios, permite obviar la existencia del error o distancia entre la realidad y el modelo. Los modelos tericos a los que se ace referencia se reducen en muc os casos a !o incluyen en su formulacin" funciones de probabilidad. La teora de la probabilidad tiene su ori#en en el estudio de los jue#os de a$ar, que impulsaron los primeros estudios sobre clculo de probabilidades en el si#lo %&', aunque no es asta el si#lo %&''' cuando se aborda la probabilidad desde una perspectiva matemtica con la demostracin de la (ley d)bil de los #randes n*meros+ se#*n la cual, al aumentar el n*mero de pruebas, la frecuencia de un suceso tiende a aproximarse a un n*mero fijo denominado probabilidad. ,ste enfoque, denominado enfoque frecuentista, se modela matemticamente en el si#lo %% cuando -olmo#orov formula la teora axiomtica de la probabilidad.. Dic a teora define la probabilidad como una funcin que asi#na a cada posible resultado de un experimento aleatorio un valor no ne#ativo, de forma que se cumpla la propiedad aditiva. La definicin axiomtica establece las re#las que deben cumplir las probabilidades, aunque no asi#na valores concretos. Uno de los conceptos ms importantes de la teora de probabilidades es el de variable aleatoria que, intuitivamente, puede definirse como cualquier caracterstica medible que toma diferentes valores con probabilidades determinadas. /oda variable aleatoria posee una distribucin de probabilidad que describe su comportamiento !vale decir, que desa#re#a el . a lo lar#o de los valores posibles de la variable". 0i la variable es discreta, es decir, si toma valores aislados dentro de un intervalo, su distribucin de probabilidad especifica todos los valores posibles de la variable junto con la probabilidad de que cada uno ocurra. ,n el caso continuo, es decir, cuando la variable puede tomar cualquier valor de un intervalo, la distribucin de probabilidad permite determinar las probabilidades correspondientes a con subintervalos de valores. Una forma usual de describir la distribucin de probabilidad de una variable aleatoria es mediante la denominada funcin de densidad, en tanto que lo que se conoce como funcin de distribucin representa las probabilidades acumuladas123. Una de las preocupaciones de los cientficos a sido construir modelos de distribuciones de probabilidad que pudieran representar el comportamiento terico de diferentes fenmenos aleatorios que aparecan en el mundo real. La pretensin de modelar lo observable a constituido siempre una necesidad bsica para el cientfico emprico, dado que a trav)s de esas construcciones tericas, los modelos, poda experimentar sobre aquello que la realidad no le permita. Por otra parte, un modelo resulta extremadamente *til, siempre que se corresponda con la realidad que pretende representar o predecir, de manera que pon#a de relieve las propiedades ms importantes del mundo que nos rodea, aunque sea a costa de la simplificacin que implica todo modelo.

,n la prctica ay unas cuantas leyes de probabilidad tericas, como son, por ejemplo, la ley binomial o la de Poisson para variables discretas o la ley normal para variables continuas, que sirven de modelo para representar las distribuciones empricas ms frecuentes. 5s, por ejemplo, la variable (talla de un reci)n nacido+ puede tener valores entre 63 cm y 74 cm, pero no todos los valores tienen la misma probabilidad, porque las ms frecuentes son las tallas prximas a los 78 cm. ,n este caso la ley normal se adapta satisfactoriamente a la distribucin de probabilidad emprica, que se obtendra con una muestra #rande de casos. ,pidat 4.. ofrece, en este mdulo, procedimientos usuales para calcular probabilidades y sus inversas, para un conjunto bastante amplio de funciones de distribucin, discretas y continuas, que son abituales en el proceso de modelacin. Por ejemplo, el conjunto de distribuciones pertenecientes a la familia exponencial es de uso frecuente en metodolo#as como el anlisis de supervivencia o el 9odelo Lineal :enerali$ado. ;tras distribuciones son comunes y abituales en el campo de actuacin de disciplinas tales como la economa, la biolo#a, etc. <uando la opcin ele#ida es el clculo de una probabilidad dado un punto x de la distribucin, se presentan en todos los casos dos resultados= la probabilidad acumulada asta ese punto, o la probabilidad de que la variable tome valores inferiores o i#uales a x !cola i$quierda" y la probabilidad de valores superiores a x !cola derec a". ,n el caso continuo, la probabilidad de que la variable sea i#ual a cualquier punto es i#ual a cero> por tanto, no influye en las colas el ec o de incluir o excluir el punto x. ?ay un tercer resultado que el pro#rama presenta slo para las distribuciones continuas sim)tricas !normal, lo#stica y t de 0tudent"= la probabilidad de dos colas, es decir, la probabilidad que queda a ambos lados del intervalo !2x, x" !x, 2x", se#*n el punto sea positivo o ne#ativo, respectivamente. 5simismo, los resultados de ,pidat 4.. incluyen la media y la varian$a de la correspondiente distribucin, as como la mediana y@o la moda en el caso de las distribuciones continuas. ,pidat 4.. tambi)n ofrece la posibilidad de representar, #rficamente, las funciones de distribucin y densidad.

DISTRIBUCIONES DISCRETAS
Las distribuciones discretas incluidas en el mdulo de (<lculo de probabilidades+ son= Uniforme discreta Ainomial ?iper#eom)trica :eom)trica Ainomial Be#ativa Poisson

Distribucin Uniforme discreta (a,b)


Describe el comportamiento de una variable discreta que puede tomar n valores distintos con la misma probabilidad cada uno de ellos. Un caso particular de esta distribucin, que es la que se incluye en este mdulo de ,pidat 4.., ocurre cuando los valores son enteros consecutivos. ,sta distribucin asi#na i#ual probabilidad a todos los valores enteros entre el lmite inferior y el lmite superior que definen el recorrido de la variable. 0i la variable puede tomar valores entre a y b, debe ocurrir que b sea mayor que a, y la variable toma los valores enteros empe$ando por a, aC., aC1, etc. asta el valor mximo b. Por ejemplo, cuando se observa el n*mero obtenido tras el lan$amiento de un dado perfecto, los valores posibles

si#uen una distribucin uniforme discreta en D., 1, 4, 6, 7, EF, y la probabilidad de cada cara es .@E. Valores= x= a, aC., aC1, ..., b, n*meros enteros Parmetros= a= mnimo, a entero b: mximo, b entero con a < b Ejercicio ,l temario de un examen para un proceso selectivo contiene 78 temas, de los cuales se ele#ir uno por sorteo. 0i una persona no a estudiado los .7 *ltimos temas G<ul es la probabilidad de que apruebe el examenH La variable que representa el n*mero del tema seleccionado para el examen si#ue una distribucin uniforme con parmetros aI. y bI78. La persona aprueba el examen si le toca un tema del . al 47> por tanto, la probabilidad que se pide es la cola a la i$quierda de 47. Para obtener los resultados en ,pidat 4.. basta con proporcionarle los parmetros de la distribucin, y seleccionar calcular probabilidades para el punto 47. Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones discretas Uniforme discreta (a,b) a : Mnimo b : Mximo !unto " !robabilidad !r$%&'( Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/'( Media 0arian+a 1 5 #5 , ) 0,7000 ,# )5,5 ) 1,)5

La persona tiene una probabilidad de aprobar i#ual a 8,3.

Distribucin Binomial (n,p)


La distribucin binomial es una distribucin discreta muy importante que sur#e en muc as aplicaciones bioestadsticas. ,sta distribucin aparece de forma natural al reali$ar repeticiones independientes de un experimento que ten#a respuesta binaria, #eneralmente clasificada como ()xito+ o (fracaso+. Por ejemplo, esa respuesta puede ser el bito de fumar !s@no", si un paciente ospitali$ado desarrolla o no una infeccin, o si un artculo de un lote es o no defectuoso. La variable discreta que cuenta el n*mero de )xitos en n pruebas independientes de ese experimento, cada una de ellas con la misma probabilidad de ()xito+ i#ual a p, si#ue una distribucin binomial de parmetros n y p. ,ste modelo se aplica a poblaciones finitas de las que se toma elementos al a$ar con reempla$o, y tambi)n a poblaciones conceptualmente infinitas, como por ejemplo las pie$as que produce una mquina, siempre que el proceso de produccin sea estable !la proporcin de pie$as defectuosas se mantiene constante a lar#o pla$o" y sin memoria !el resultado de cada pie$a no depende de las anteriores".

Un ejemplo de variable binomial puede ser el n*mero de pacientes in#resados en una unidad ospitalaria que desarrollan una infeccin nosocomial. Un caso particular se tiene cuando nI., que da lu#ar a la distribucin de Aernoulli. Valores= x= 8, ., 1, ..., n Parmetros= n= n*mero de pruebas, n K 8 entero p: probabilidad de )xito, 8 L p < . Ejercicio ,n un examen formado por 18 pre#untas, cada una de las cuales se responde declarando (verdadero+ o (falso+, el alumno sabe que, istricamente, en el 37M de los casos la respuesta correcta es (verdadero+ y decide responder al examen tirando dos monedas, pone (falso+ si ambas monedas muestran una cara y (verdadero+ si al menos ay una cru$. 0e desea saber qu) probabilidad ay de que ten#a al menos .6 aciertos. ?ay que proporcionarle a ,pidat 4.. los parmetros de la distribucin y el punto k a partir del cual se calcular la probabilidad. ,n este caso nI18, pI8,37 y el punto kI.6. Jesultados con ,pidat 4.. Clculo de probabilidades. Distribuciones discretas
2inomial (n,p) n: 34mero de pruebas p: !robabilidad de 5xito !unto " !robabilidad !r$%&'( Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/'( Media 0arian+a ) ,65 17

,1818 ,#1)1 0,6172 15, #,65

La probabilidad de que el alumno ten#a ms de .6 aciertos se sit*a en 8,E..

Distribucin Hipergeomtrica (N,R,n)


La distribucin iper#eom)trica suele aparecer en procesos muestrales sin reempla$o, en los que se investi#a la presencia o ausencia de cierta caracterstica. Pi)nsese, por ejemplo, en un procedimiento de control de calidad en una empresa farmac)utica, durante el cual se extraen muestras de las cpsulas fabricadas y se someten a anlisis para determinar su composicin. Durante las pruebas, las cpsulas son destruidas y no pueden ser devueltas al lote del que provienen. ,n esta situacin, la variable que cuenta el n*mero de cpsulas que no cumplen los criterios de calidad establecidos si#ue una distribucin iper#eom)trica. Por tanto, esta distribucin es la equivalente a la binomial, pero cuando el muestreo se ace sin reempla$o. ,sta distribucin se puede ilustrar del modo si#uiente= se tiene una poblacin finita con B elementos, de los cuales J tienen una determinada caracterstica que se llama ()xito+

!diabetes, obesidad, bito de fumar, etc.". ,l n*mero de ()xitos+ en una muestra aleatoria de tamaNo n, extrada sin reempla$o de la poblacin, es una variable aleatoria con distribucin iper#eom)trica de parmetros B, J y n. <uando el tamaNo de la poblacin es #rande, los muestreos con y sin reempla$o son equivalentes, por lo que la distribucin iper#eom)trica se aproxima en tal caso a la binomial. Valores= x= max{0,n-(N- !", ###, min{ ,n", donde max{0,n-(N- "F indica el valor mximo entre 0 y n(N- ! $ min{ ,n" indica el valor mnimo entre y n. Parmetros= N= tamaNo de la poblacin, NK8 entero = n*mero de )xitos en la poblacin, 8 entero n= n*mero de pruebas, nK8 entero Ejercicio 0e sabe que el 3M de los *tiles quir*r#icos en un lote de .88 no cumplen ciertas especificaciones de calidad. /omada una muestra al a$ar de .8 unidades sin reempla$o, interesa conocer la probabilidad de que no ms de dos sean defectuosos. ,l n*mero de *tiles defectuosos en el lote es JI8,83.88I3. Para un tamaNo muestral de nI.8, la probabilidad buscada es PDn*mero de defectuosos 1F. Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones discretas 9iper:eom5trica (3,;,n) 3 : <ama=o de la poblaci>n ; : 34mero 5xitos en la pob. n : 34mero de pruebas !unto " !robabilidad !r$%&'( Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/'( Media 0arian+a 1 1 6 ) ,1)#5 0,9792 , ) 1 ,6 ,5?11

La probabilidad de que a lo sumo aya dos *tiles defectuosos en el lote es aproximadamente 8,OP.

Distribucin Geomtrica (p)


0upn#ase, que se efect*a repetidamente un experimento o prueba, que las repeticiones son independientes y que se est interesado en la ocurrencia o no de un suceso al que se refiere como ()xito+, siendo la probabilidad de este suceso p. La distribucin #eom)trica permite calcular la probabilidad de que ten#a que reali$arse un n*mero Q de repeticiones asta obtener un )xito por primera ve$. 5s pues, se diferencia de la distribucin binomial en que el n*mero de repeticiones no est predeterminado, sino que es la variable aleatoria que se mide y, por otra parte, el conjunto de valores posibles de la variable es ilimitado.

Para ilustrar el empleo de esta distribucin, se supone que cierto medicamento opera exitosamente ante la enfermedad para la cual fue concebido en el P8M de los casos a los que se aplica> la variable aleatoria (intentos fallidos en la aplicacin del medicamento antes del primer )xito+ si#ue una distribucin #eom)trica de parmetro pI8,P. ;tro ejemplo de variable #eom)trica es el n*mero de ijos asta el nacimiento de la primera niNa. La distribucin #eom)trica se utili$a en la distribucin de tiempos de espera, de manera que si los ensayos se reali$an a intervalos re#ulares de tiempo, esta variable aleatoria proporciona el tiempo transcurrido asta el primer )xito. ,sta distribucin presenta la denominada (propiedad de ?arQov+ o de falta de memoria, que implica que la probabilidad de tener que esperar un tiempo t no depende del tiempo que ya aya transcurrido. Valores: x= 8, ., 1, ... Parmetros= p= probabilidad de )xito, 8Lp<. Ejercicio La probabilidad de que cierto examen m)dico d) lu#ar a una reaccin (positiva+ es i#ual a 8,P, Gcul es la probabilidad de que ocurran menos de 7 reacciones (ne#ativas+ antes de la primera positivaH La variable aleatoria (n*mero de reacciones ne#ativas antes de la primera positiva+ si#ue una distribucin :eom)trica con parmetro pI8,P. Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones discretas @eom5trica (p) p : !robabilidad de 5xito !unto " !robabilidad !r$%&'( Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/'( Media 0arian+a ,1 7 , 1# 0,9997 , # ,)5 ,#1)5

La probabilidad de que ocurran menos de 7 reacciones (ne#ativas+ antes de la primera positiva es casi . !8,OOO3".

Distribucin Binomial negati a (r,p)


Una #enerali$acin obvia de la distribucin #eom)trica aparece si se supone que un experimento se contin*a asta que un determinado suceso, de probabilidad p, ocurre por r2 )sima ve$. La variable aleatoria que proporciona la probabilidad de que se produ$can k fracasos antes de obtener el r2)simo )xito si#ue una distribucin binomial ne#ativa de parmetros r y p, AB!r,p". La distribucin #eom)trica corresponde al caso particular en que rI.. Un ejemplo es el n*mero de lan$amientos fallidos de un dado antes de obtener un E en tres ocasiones, que si#ue una AB!4,.@E".

,n el caso de que los sucesos ocurran a intervalos re#ulares de tiempo, esta variable proporciona el tiempo total para que ocurran r )xitos, por lo que tambi)n se denomina (distribucin binomial de tiempo de espera+. La distribucin binomial ne#ativa fue propuesta, ori#inalmente, como una alternativa a la distribucin de Poisson para modelar el n*mero de ocurrencias de un suceso cuando los datos presentan lo que se conoce como variacin extra2Poisson o sobredispersin. ,n estas situaciones, la varian$a es mayor que la media, por lo que se incumple la propiedad que caracteri$a a una distribucin de Poisson, se#*n la cual la media es i#ual a la varian$a. La primera aplicacin en bioestadstica la reali$ 0tudent !Rilliam 0. :osset" a principios de si#lo cuando propuso esta distribucin para modelar el n*mero de #lbulos rojos en una #ota de san#re. ,n este caso, la variabilidad extra se debe al ec o de que esas c)lulas no estn uniformemente distribuida en la #ota, es decir, la tasa de intensidad no es omo#)nea. Por ejemplo, la distribucin binomial ne#ativa es ms adecuada que la de Poisson para modelar el n*mero de accidentes laborales ocurridos en un determinado lapso. La distribucin de Poisson asume que todos los individuos tienen la misma probabilidad de sufrir un accidente y que )sta permanece constante durante el perodo de estudio> sin embar#o, es ms plausible la iptesis de que los individuos tienen probabilidades constantes en el tiempo, pero que varan de unos sujetos a otros> esto es lo que se conoce en la literatura como la propensin a los accidentes !(acci%ent proneness+"P,O. ,sta iptesis se traduce en una distribucin de Poisson mixta, o de efectos aleatorios, en la que se supone que las probabilidades varan entre individuos de acuerdo a una distribucin #amma y esto resulta en una distribucin binomial ne#ativa para el n*mero de accidentes. Valores: x= 8, ., 1, ... Parmetros: p= probabilidad de )xito, 8LpL. r> n*mero de )xitos, r8 Ejercicio 0e sabe que, en promedio, de cada .88 placas de rayos % que se reali$an, una es defectuosa. G<ul es el n*mero medio de placas *tiles que se producen entre .8 defectuosasH 0i se considera el primer fallo como punto de inicio, ay que considerar la variable (n*mero de placas *tiles antes de O defectuosas+, que si#ue una distribucin binomial ne#ativa de parmetros rIO y pI8,8.. Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones discretas 2inomial ne:atiAa (r,p) r : 34mero de 5xitos p : !robabilidad de 5xito !unto " Media 0arian+a ? 1 891,0000 1?1 ,

, 1

,ntre .8 placas defectuosas se producen, en promedio, unas PO. placas *tiles.

Distribucin !oisson (lambda)


La distribucin de Poisson, que debe su nombre al matemtico franc)s 0imen Denis Poisson !.3P.2.P68", ya aba sido introducida en .3.P por 5bra am De 9oivre como una forma lmite de la distribucin binomial que sur#e cuando se observa un evento raro despu)s de un n*mero #rande de repeticiones.8. ,n #eneral, la distribucin de Poisson se puede utili$ar como una aproximacin de la binomial, Ain!n, p", si el n*mero de pruebas n es #rande, pero la probabilidad de )xito p es pequeNa> una re#la es que la aproximacin Poisson2binomial es (buena+ si n18 y p8,87 y (muy buena+ si n.88 y p8,8.. La distribucin de Poisson tambi)n sur#e cuando un evento o suceso (raro+ ocurre aleatoriamente en el espacio o el tiempo. La variable asociada es el n*mero de ocurrencias del evento en un intervalo o espacio continuo, por tanto, es una variable aleatoria discreta que toma valores enteros de 8 en adelante !8, ., 1,...". 5s, el n*mero de pacientes que lle#an a un consultorio en un lapso dado, el n*mero de llamadas que recibe un servicio de atencin a ur#encias durante . ora, el n*mero de c)lulas anormales en una superficie istol#ica o el n*mero de #lbulos blancos en un milmetro c*bico de san#re son ejemplos de variables que si#uen una distribucin de Poisson. ,n #eneral, es una distribucin muy utili$ada en diversas reas de la investi#acin m)dica y, en particular, en epidemiolo#a. ,l concepto de evento (raro+ o poco frecuente debe ser entendido en el sentido de que la probabilidad de observar Q eventos decrece rpidamente a medida que Q aumenta. 0upn#ase, por ejemplo, que el n*mero de reacciones adversas tras la administracin de un frmaco si#ue una distribucin de Poisson de media lamb%aI1. 0i se administra este frmaco a ..888 individuos, la probabilidad de que se produ$ca una reaccin adversa !QI." es 8,13> los valores de dic a probabilidad para QI1, 4, 6, 7, E reacciones, respectivamente, son= 8,13> 8,.P> 8,8O> 8,84 y 8,8.. Para QI.8 o mayor, la probabilidad es virtualmente 8. ,l rpido descenso de la probabilidad de que se produ$can Q reacciones adversas a medida que Q aumenta puede observarse claramente en el #rfico de la funcin de densidad obtenido con ,pidat 4..=

Para que una variable recuento si#a una distribucin de Poisson deben cumplirse varias condiciones= .. ,n un intervalo muy pequeNo !p. e. de un milise#undo" la probabilidad de que ocurra un evento es proporcional al tamaNo del intervalo.

.8

1. La probabilidad de que ocurran dos o ms eventos en un intervalo muy pequeNo es tan reducida que, a efectos prcticos, se puede considerar nula. 4. ,l n*mero de ocurrencias en un intervalo pequeNo no depende de lo que ocurra en cualquier otro intervalo pequeNo que no se solape con aqu)l. ,stas propiedades pueden resumirse en que el proceso que #enera una distribucin de Poisson es estable !produce, a lar#o pla$o, un n*mero medio de sucesos constante por unidad de observacin" y no tiene memoria !conocer el n*mero de sucesos en un intervalo no ayuda a predecir el n*mero de sucesos en el si#uiente". ,l parmetro de la distribucin, lamb%a, representa el n*mero promedio de eventos esperados por unidad de tiempo o de espacio, por lo que tambi)n se suele ablar de lamb%a como (la tasa de ocurrencia+ del fenmeno que se observa. 5 veces se usan variables de Poisson con SintervalosS que no son espaciales ni temporales, sino de otro tipo. Por ejemplo, para medir la frecuencia de una enfermedad se puede contar, en un perodo dado, el n*mero de enfermos en cierta poblacin, dividida en SintervalosS de, por ejemplo, .8.888 abitantes. 5l n*mero de personas enfermas en una poblacin de tamaNo prefijado, en un instante dado, se le denomina prevalencia de la enfermedad en ese instante y es una variable que si#ue una distribucin de Poisson. ;tra medida para la frecuencia de una enfermedad es la incidencia, que es el n*mero de personas que enferman en una poblacin en un periodo determinado. ,n este caso, el intervalo es de personas2 tiempo, abitualmente personas2aNo, y es tambi)n una variable con distribucin de Poisson. ?abitualmente, ambas medidas se expresan para intervalos de tamaNo unidad o, dic o de otro modo, en lu#ar de la variable n*mero de enfermos, se usa el parmetro lamb%a !el ries#o, en el caso de la prevalencia, y la densidad de incidencia, en el de incidencia". La distribucin de Poisson tiene i#uales la media y la varian$a. 0i la variacin de los casos observados en una poblacin excede a la variacin esperada por la Poisson, se est ante la presencia de un problema conocido como sobredispersin y, en tal caso, la distribucin binomial ne#ativa es ms adecuada. Valores: x= 8, ., 1, ... Parmetros= lamb%a= media de la distribucin, lamb%a K 8

Ejercicio ,l n*mero de enfermos que solicitan atencin de ur#encia en un ospital durante un periodo de 16 oras tiene una media de 64,1 pacientes. 0e sabe que el servicio se colapsar si el n*mero de enfermos excede de 78. G<ul es la probabilidad de que se colapse el servicio de ur#encias del ospitalH Jepresentar la funcin de densidad de probabilidad. Para calcular la probabilidad pedida y, adems, representar la funcin de densidad de probabilidad ay que marcar el cuadro situado en la parte inferior derec a de la pantalla= &btener las funciones %e %istribuci'n $ %ensi%a%#

..

Jesultados con ,pidat 4..


Clculo de probabilidades. Distribuciones discretas !oisson (lambda) lambda : Media !unto " !robabilidad !r$%&'( Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/'( Media 0arian+a 7#,) 5 , ##? ,1856 0,1343 7#,) 7#,)

La probabilidad de que el servicio colapse est cerca de 8,.4.

DISTRIBUCIONES CONTINUAS
Las distribuciones continuas incluidas en el mdulo de (<lculo de probabilidades+ son= Uniforme Bormal Lo#normal Lo#stica Aeta :amma ,xponencial Ti2cuadrado t de 0tudent U de 0nedecor

Distribucin Uniforme (a,b)


La distribucin uniforme es *til para describir una variable aleatoria con probabilidad constante sobre el intervalo Va,bW en el que est definida. ,sta distribucin presenta una peculiaridad importante= la probabilidad de un suceso depender exclusivamente de la amplitud del intervalo considerado y no de su posicin en el campo de variacin de la variable.

.1

<ualquiera sea la distribucin U de cierta variable %, la variable transformada XIU!%" si#ue una distribucin uniforme en el intervalo V8,.W. ,sta propiedad es fundamental por ser la base para la #eneracin de n*meros aleatorios de cualquier distribucin en las t)cnicas de simulacin. (ampo %e )ariaci'n= axb Parmetros= a= mnimo del recorrido b= mximo del recorrido Ejercicio 0upn#ase una variable que se distribuye uniformemente entre 4P8 y ..188. Determnese= .. La probabilidad de que el valor de la variable sea superior a mil. 1. La media y la desviacin estndar de dic a variable. 5 ,pidat se le proporcionar el lmite superior e inferior del campo de variacin de la variable V4P8, ..188W y, adems, el punto a partir del cual se quiere calcular la probabilidad. Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones continuas Uniforme (a,b) a : Mnimo b : Mximo !unto % Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( Media 0arian+a Mediana #1 , 1) 1

, , ,6581 0,2439

790,0000 56033,3333 6? ,

La probabilidad de que la variable sea superior a mil se sit*a en un entorno de 8,16, la media es 3O8 y la desviacin estndar, ra$ cuadrada de la varian$a, es aproximadamente 143. Ejercicio

Un contratista A est? preparan%o !na o#erta so re !n n!e/o pro@ecto %e constr!cci"n. La o#erta sig!e !na %istri !ci"n !ni#or$e entre )) @ .) $iles %e e!ros. Deter$5nese>
.. La probabilidad de que la oferta sea superior a E8 mil euros. 1. La media y la desviacin estndar de la oferta. 5 ,pidat se le proporcionar el lmite superior e inferior del campo de variacin de la variable V77, 37W y, adems, el punto a partir del cual se quiere calcular la probabilidad.

.4

Jesultados con ,pidat 4.. Clculo de probabilidades. Distribuciones continuas


Uniforme (a,b) a : Mnimo b : Mximo !unto % Cola *+,uierda Cola Derec.a Media 0arian+a Mediana !r$%-&'( !r$%/&'( 55, 65, 8 , ,)5 0,7500 65,0000 33,3333 85,

La probabilidad de que la oferta sea superior a E8 mil euros se sit*a en un entorno de 8,37, y la media es E7.

Distribucin Normal ("u, #igma)


La distribucin normal es, sin duda, la distribucin de probabilidad ms importante del <lculo de probabilidades y de la ,stadstica. Uue descubierta por De 9oivre !.334", como aproximacin de la distribucin binomial. De todas formas, la importancia de la distribucin normal queda totalmente consolidada por ser la distribucin lmite de numerosas variables aleatorias, discretas y continuas, como se demuestra a trav)s de los teoremas centrales del lmite. Las consecuencias de estos teoremas implican la casi universal presencia de la distribucin normal en todos los campos de las ciencias empricas= biolo#a, medicina, psicolo#a, fsica, economa, etc. ,n particular, muc as medidas de datos continuos en medicina y en biolo#a !talla, presin arterial, etc." se aproximan a la distribucin normal. Tunto a lo anterior, no es menos importante el inter)s que supone la simplicidad de sus caractersticas y de que de ella derivan, entre otras, tres distribuciones !Ti2cuadrado, t y U" que se mencionarn ms adelante, de importancia clave en el campo de la contrastacin de iptesis estadsticas. La distribucin normal queda totalmente definida mediante dos parmetros= la media !*u" y la desviacin estndar !+i,ma". (ampo %e )ariaci'n= 2 L x L

Parmetros= *u= media de la distribucin, 2 L *u L +i,ma= desviacin estndar de la distribucin, +i,ma K 8 Ejercicio 0e supone que el nivel de colesterol de los enfermos de un ospital si#ue una distribucin normal con una media de .3O,. m#@dL y una desviacin estndar de 1P,1 m#@dL. .. <alcule el porcentaje de enfermos con un nivel de colesterol inferior a .EO m#@dL.

.6

1. G<ul ser el valor del nivel de colesterol a partir del cual se encuentra el .8M de los enfermos del ospital con los niveles ms altosH 4. Jepresente la funcin de densidad. ,n este caso, se tendr que ejecutar ,pidat 4.. dos veces= en el primer caso para calcular una probabilidad, en el se#undo caso el dato de entrada es una probabilidad, concretamente la cola de la derec a, lo que permitir obtener el punto. ,n ambas ejecuciones se ofrece, de manera opcional, la funcin de densidad del nivel de colesterol. .. Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones continuas 3ormal (Mu,Bi:ma) Mu : Media Bi:ma : DesAiaci>n estndar !unto % Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( Dos Colas 1C!r$D%D-&'( 16?,1 )1,) 18?, 0,3601 ,8#?? ,6) )

,l porcentaje de enfermos con un nivel de colesterol inferior a .EO m#@dL es 4EM. 1. Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones continuas 3ormal (Mu,Bi:ma) Mu : Media 16?,1 Bi:ma : DesAiaci>n estndar )1,) Cola *+,uierda !r$%-&'( ,? Cola Derec.a !r$%/&'( ,1 Dos Colas 1C!r$D%D-&'( ,) !unto % 215,2398

5 partir de 1.7,16 m#@dL se encuentran los valores de colesterol del .8M de los enfermos que tienen los valores ms altos.

.7

Distribucin $ognormal ("u, #igma)


La variable resultante al aplicar la funcin exponencial a una variable que se distribuye normal con media *u y desviacin estndar +i,ma, si#ue una distribucin lo#normal con parmetros *u !escala" y +i,ma !forma". Dic o de otro modo, si una variable % se distribuye normalmente, la variable ln%, si#ue una distribucin lo#normal. La distribucin lo#normal es *til para modelar datos de numerosos estudios m)dicos tales como el perodo de incubacin de una enfermedad, los ttulos de anticuerpo a un virus, el tiempo de supervivencia en pacientes con cncer o 0'D5, el tiempo asta la seroconversin de &'?C, etc. (ampo %e )ariaci'n= 0LxL Parmetros= *u= parmetro de escala, 2 L *u L +i,ma= parmetro de forma, +i,ma K 8 Ejercicio 0upn#ase que la supervivencia, en aNos, lue#o de una intervencin quir*r#ica !tiempo que pasa asta que ocurre la muerte del enfermo" en una cierta poblacin si#ue una distribucin lo#normal de parmetro de escala 1,41 y de forma 8,18. <alc*lese la probabilidad de supervivencia a los .1 aNos, la mediana de supervivencia y represente la funcin de distribucin de la variable. Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones continuas Eo:normal (Mu,Bi:ma) Mu : Fscala Bi:ma : Gorma !unto % Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( Media 0arian+a Mediana Moda ),#) ,) 1), ,6?5) 0,2048 1 ,#11) 7,#?1) 10,1757 ?,6686

La probabilidad de supervivencia a los .1 aNos se sit*a prximo a 8,18. La funcin de distribucin de la supervivencia a la intervencin quir*r#ica se presenta a continuacin=

.E

Distribucin $og%stica (a, b)


La distribucin lo#stica se utili$a en el estudio del crecimiento temporal de variables, en particular, demo#rficas. ,n biolo#a se a aplicado, por ejemplo, para modelar el crecimiento de c)lulas de levadura, y para representar curvas de dosis2respuesta en bioensayos. La ms conocida y #enerali$ada aplicacin de la distribucin lo#stica en <iencias de la 0alud se fundamenta en la si#uiente propiedad= si U es una variable uniformemente distribuida en U si#ue una distribucin lo#stica. ,sta el intervalo V8,.W, entonces la variable A = ln 1 U transformacin, denominada lo,it, se utili$a para modelar datos de respuesta binaria, especialmente en el contexto de la re#resin lo#stica. (ampo %e )ariaci'n= 2 L x L Parmetros= a= parmetro de posicin, 2 L a L b= parmetro de escala, b K 8

Ejercicio ,l crecimiento relativo anual !M" de la poblacin de un determinado pas si#ue una distribucin lo#stica de parmetro de posicin . y de escala 1. <alcular la probabilidad de que el crecimiento en un aNo determinado sea superior al 7M y representar la funcin de densidad.

.3

Jesultados con ,pidat 4..


Clculo de probabilidades. Distribuciones continuas Eo:stica (a,b) a : !osici>n 1, b : Fscala ), !unto % 5, Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( Dos Colas 1C!r$D%D-&'( Media 0arian+a Mediana Moda ,11 1 0,1192 ,)#17 1, 1#,15?5 1, 1,

La probabilidad de que la poblacin ten#a un crecimiento superior al 7M es del orden de 8,.1.

Distribucin Beta (p,&)


La distribucin beta es posible para una variable aleatoria continua que toma valores en el intervalo V8,.W, lo que la ace muy apropiada para modelar proporciones. ,n la inferencia bayesiana, por ejemplo, es muy utili$ada como distribucin a priori cuando las observaciones tienen una distribucin binomial. Uno de los principales recursos de esta distribucin es el ajuste a una #ran variedad de distribuciones empricas, pues adopta formas muy diversas dependiendo de cules sean los valores de los parmetros de forma p y q, mediante los que viene definida la distribucin. Un caso particular de la distribucin beta es la distribucin uniforme en V8,.W, que se corresponde con una beta de parmetros pI. y qI., denotada Aeta!.,.". (ampo %e )ariaci'n= 8x. Parmetros= p= parmetro de forma, p K 8 q= parmetro de forma, q K 8
.P

Ejercicio ,n el presupuesto familiar, la porcin que se dedica a salud si#ue una distribucin Aeta!1,1". .. G<ul es la probabilidad de que se #aste ms del 17M del presupuesto familiar en saludH 1. G<ul ser el porcentaje medio que las familias dedican a la compra de productos y servicios de saludH Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones continuas 2eta (p,,) p : Gorma , : Gorma !unto % Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( Media 0arian+a Moda ), ), ,)5 ,158# 0,8438 0,5000 , 5 ,5

/eniendo en cuenta la distribucin beta, la probabilidad de que se #aste ms de la cuarta parte del presupuesto en salud ser 8,P6 y el porcentaje medio que las familias dedican a la compra de productos y servicios de salud ser el 78M.

Distribucin Gamma (a,p)


La distribucin #amma se puede caracteri$ar del modo si#uiente= si se est interesado en la ocurrencia de un evento #enerado por un proceso de Poisson de media lamb%a, la variable que mide el tiempo transcurrido asta obtener n ocurrencias del evento si#ue una distribucin #amma con parmetros aI nlamb%a !escala" y p-n !forma". 0e denota :amma!a,p". Por ejemplo, la distribucin #amma aparece cuando se reali$a el estudio de la duracin de elementos fsicos !tiempo de vida". ,sta distribucin presenta como propiedad interesante la (falta de memoria+. Por esta ra$n, es muy utili$ada en las teoras de la fiabilidad, mantenimiento y fenmenos de espera !por ejemplo en una consulta m)dica (tiempo que transcurre asta la lle#ada del se#undo paciente+". (ampo %e )ariaci'n= 8LxL Parmetros= a= parmetro de escala, a K 8 p= parmetro de forma, p K 8

.O

Ejercicio 1 ,l n*mero de pacientes que lle#an a la consulta de un m)dico si#ue una distribucin de Poisson de media 4 pacientes por ora. <alcular la probabilidad de que transcurra menos de una ora asta la lle#ada del se#undo paciente. Debe tenerse en cuenta que la variable aleatoria (tiempo que transcurre asta la lle#ada del se#undo paciente+ si#ue una distribucin :amma !E, 1".

Jesultados con ,pidat 4..


Clculo de probabilidades. Distribuciones continuas @amma (a,p) a : Fscala p : Gorma !unto % Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( Media 0arian+a Moda 8, ), 1, 0,9826 , 167 ,#### , 558 ,1886

La probabilidad de que transcurra menos de una ora asta que lle#ue el se#undo paciente es 8,OP. Ejercicio 2 0uponiendo que el tiempo de supervivencia, en aNos, de pacientes que son sometidos a una cierta intervencin quir*r#ica en un ospital si#ue una distribucin :amma con parmetros aI8,P. y pI3,P., calc*lese= .. ,l tiempo medio de supervivencia. 1. Los aNos a partir de los cuales la probabilidad de supervivencia es menor que 8,..

Jesultados con ,pidat 4..


Clculo de probabilidades. Distribuciones continuas @amma (a,p) a : Fscala p : Gorma Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( !unto % Media 0arian+a Moda ,11 6,11 ,? ,1 14,2429 9,6420 11,? #6 1,7 67

,l tiempo medio de supervivencia es de, aproximadamente, .8 aNos.

18

Distribucin '(ponencial (lambda)


La distribucin exponencial es el equivalente continuo de la distribucin #eom)trica discreta. ,sta ley de distribucin describe procesos en los que interesa saber el tiempo asta que ocurre determinado evento> en particular, se utili$a para modelar tiempos de supervivencia. Un ejemplo es el tiempo que tarda una partcula radiactiva en desinte#rarse. ,l conocimiento de la ley que si#ue este evento se utili$a, por ejemplo, para la datacin de fsiles o cualquier materia or#nica mediante la t)cnica del carbono .6. Una caracterstica importante de esta distribucin es la propiedad conocida como (falta de memoria+. ,sto si#nifica, por ejemplo, que la probabilidad de que un individuo de edad t sobreviva x aNos ms, asta la edad x.t, es la misma que tiene un reci)n nacido de sobrevivir asta la edad x. Dic o de manera ms #eneral, el tiempo transcurrido desde cualquier instante dado t8 asta que ocurre el evento, no depende de lo que aya ocurrido antes del instante t0. La distribucin exponencial se puede caracteri$ar como la distribucin del tiempo entre sucesos consecutivos #enerados por un proceso de Poisson> por ejemplo, el tiempo que transcurre entre dos eridas #raves sufridas por una persona. La media de la distribucin de Poisson, lamb%a, que representa la tasa de ocurrencia del evento por unidad de tiempo, es el parmetro de la distribucin exponencial, y su inversa es el valor medio de la distribucin. /ambi)n se puede ver como un caso particular de la distribucin #amma!a,p", con aIlamb%a y pI.. ,l uso de la distribucin exponencial a sido limitado en bioestadstica, debido a la propiedad de falta de memoria que la ace demasiado restrictiva para la mayora de los problemas. (ampo %e )ariaci'n= 8LxL Parmetros: lamb%a= tasa, lamb%a K 8 Ejercicio 0e a comprobado que el tiempo de vida de cierto tipo de marcapasos si#ue una distribucin exponencial con media de .E aNos. G<ul es la probabilidad de que a una persona a la que se le a implantado este marcapasos se le deba reimplantar otro antes de 18 aNosH 0i el marcapasos lleva funcionando correctamente 7 aNos en un paciente, Gcul es la probabilidad de que aya que cambiarlo antes de 17 aNosH La variable aleatoria (tiempo de vida del marcapasos+ si#ue una distribucin exponencial de parmetro lamb%aI.@.EI8,8E17 Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones continuas Fxponencial (lambda) lambda : <asa !unto % Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( , 8)5 ) , 0,7135 ,)185

1.

La probabilidad de que se le ten#a que implantar otro marcapasos antes de los 18 aNos se sit*a en un entorno a 8,3.. /eniendo en cuenta la propiedad de (falta de memoria+ de la exponencial, la probabilidad de tener que cambiar antes de 17 aNos un marcapasos que lleva funcionando 7 es i#ual a la probabilidad de cambio a los 18 aNos, es decir, P!%L17@%K7" I P!%L18" I 8,3..

Distribucin )i*cuadrado (n)


Un caso especial, muy importante, de la distribucin :amma se obtiene cuando aI.@1 y pIn@1. La distribucin resultante se conoce con el nombre de Ti2cuadrado con n #rados de libertad. ,s la distribucin que si#ue la suma de los cuadrados de n variables independientes B!8,.". La Ti2cuadrado es una distribucin fundamental en inferencia estadstica y en los tests estadsticos de bondad de ajuste. 0e emplea, entre muc as otras aplicaciones, para determinar los lmites de confian$a de la varian$a de una poblacin normal, para contrastar la iptesis de omo#eneidad o de independencia en una tabla de contin#encia y para pruebas de bondad de ajuste. La distribucin Ti2cuadrado queda totalmente definida mediante sus #rados de libertad n# (ampo %e )ariaci'n= 8 x L Parmetros= n= #rados de libertad, n/0 Ejercicio <onsidere la distribucin Ti2cuadrado con 1 #rados de libertad. .. GYu) proporcin del rea bajo la curva se ubica a la derec a de O,1.H 1. GYu) valor de la variable asla el .8M superior de la distribucinH .. Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones continuas HiCcuadrado (n) n : @rados de libertad !unto % Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( ) ?,)1 ,?? 0,0100

,l .M del rea bajo la curva se ubica a la derec a de O,1.. 1. Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones continuas HiCcuadrado (n) n : @rados de libertad Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( !unto % ) ,? ,1 7,8 5)

11

,l valor 6,E871 divide a la distribucin en dos partes= el O8M de )sta queda a la i$quierda de dic o punto y el .8M a la derec a.

Distribucin t de #tudent (n)


La distribucin t de 0tudent se construye como un cociente entre una normal y la ra$ de una Ti2cuadrado independientes. ,sta distribucin desempeNa un papel importante en la inferencia estadstica asociada a la teora de muestras pequeNas. 0e usa abitualmente en el contraste de iptesis para la media de una poblacin, o para comparar las medias de dos poblaciones, y viene definida por sus #rados de libertad n# 5 medida que aumentan los #rados de libertad, la distribucin t de 0tudent se aproxima a una normal de media 8 y varian$a . !normal estndar". (ampo %e )ariaci'n= 2 L x L Parmetros= n= #rados de libertad, nK8 Ejercicio La distribucin t de 0tudent se aproxima a la normal a medida que aumentan los #rados de libertad. .. <alcular, para una distribucin B!8,.", el punto que deja a la derec a una cola de probabilidad 8,87.

3. <alcular, para una distribucin t de 0tudent, la probabilidad de que la variable tome


un valor a la derec a de ese punto. /omar como #rados de libertad sucesivamente nI .8 y nI 788. Para el primer apartado ay que seleccionar en la lista de distribuciones la normal de parmetros *uI8 y +i,maI.. .. Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones continuas 3ormal (Mu,Bi:ma) Mu : Media Bi:ma : DesAiaci>n estndar Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( Dos Colas 1C!r$D%D-&'( !unto % Media 0arian+a , 1, ,?5 , 5 ,1 1,6449 , 1,

,n el se#undo apartado se ejecutar dos veces ,pidat 4..= la primera ve$ con una distribucin t de 0tudent con .8 #rados de libertad y la se#unda ve$ con 788 #rados de libertad.

14

1. Jesultados con ,pidat 4..


Clculo de probabilidades. Distribuciones continuas t de Btudent (n) n : @rados de libertad !unto % Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( Dos Colas 1C!r$D%D-&'( 1 1,877? ,?#75 0,0655 ,1#1

Clculo de probabilidades. Distribuciones continuas t de Btudent (n) n : @rados de libertad !unto % Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( Dos Colas 1C!r$D%D-&'( 5 1,877? ,?7?6 0,0503 ,1 8

0e aprecia claramente que, al aumentar los #rados de libertad de la t de 0tudent, la probabilidad se acerca a la calculada con la distribucin Bormal.

Distribucin + de #nedecor (n,m)


;tra de las distribuciones importantes asociadas a la normal es la que se define como el cociente de dos variables con distribucin Ti2cuadrado divididas por sus respectivos #rados de libertad, n y m. ,n este caso la variable aleatoria si#ue una distribucin U de 0nedecor de parmetros n y m. ?ay muc as aplicaciones de la U en estadstica y, en particular, tiene un papel importante en las t)cnicas del anlisis de la varian$a y del diseNo de experimentos. (ampo %e )ariaci'n= 8xL Parmetros= n= #rados de libertad del numerador, nK8 m= #rados de libertad del denominador, mK8

Ejercicio ,n un laboratorio se efectuaron ciertas mediciones y se comprob que se#uan una distribucin U con .8 #rados de libertad en el numerador y .1 #rados de libertad en el denominador. .. <alcule el valor que deja a la derec a el 7M del rea bajo la curva de densidad. 1. G<ul es la probabilidad de que la medicin sea superior a 6,48H 4. Jepresente la funcin de distribucin y de densidad de las medidas.

16

.. Jesultados con ,pidat 4..


Clculo de probabilidades. Distribuciones continuas G de Bnedecor (n,m) n : @rados libertad del num. 1 , m : @rados libertad del denom. 1), Cola *+,uierda !r$%-&'( ,?5 Cola Derec.a !r$%/&'( , 5 !unto % 2,7534

,l valor que deja a la derec a una probabilidad de 8,87 es 1,37. 1. Jesultados con ,pidat 4..
Clculo de probabilidades. Distribuciones continuas G de Bnedecor (n,m) n : @rados libertad del num. 1 , m : @rados libertad del denom. 1), !unto % 7,# Cola *+,uierda !r$%-&'( Cola Derec.a !r$%/&'( Media 0arian+a Moda ,?? 0,0100 1,) ,6) ,8156

La probabilidad que deja a la derec a 6,48 es 8,8.. 4. Las funciones de densidad y distribucin de las medidas efectuadas se presentan a continuacin=

17

GENERACIN DE DISTRIBUCIONES Conceptos generales


,pidat 4.. ofrece procedimientos para #enerar muestras de variables aleatorias que se ajusten a determinadas distribuciones, tanto continuas como discretas. 5dems de las distribuciones disponibles en el submdulo de (<lculo de probabilidades+, en el presente se incluyen la multinomial, en las discretas, y la normal bivariante, en las continuas. ,ste submdulo puede ser *til para reali$ar ejercicios de simulacin !principalmente en estudios de investi#acin" y, adems, para calcular probabilidades asociadas a variables obtenidas a partir de otras cuyas distribuciones sean conocidas, aun cuando la variable resultante ten#a distribucin desconocida. ,l empleo de la simulacin para verificar un resultado terico es, oy en da, una prctica re#ular, #racias al desarrollo de los ordenadores que permiten obtener, rpida y fcilmente, n*meros aleatorios de cualquier distribucin. ,sto a supuesto una aut)ntica revolucin en el campo de la estadstica y, en particular, en los m)todos bayesianos. 9s que n*meros aleatorios estrictamente, los al#oritmos de simulacin #eneran lo que se a denominado como n*meros pseu%o-aleatorios a trav)s de frmulas recursivas que parten de un valor inicial llamado semilla. ,xisten diferentes m)todos de #eneracin que permiten obtener una secuencia de n*meros aleatorios para una distribucin dada, pero la mayora de estos m)todos se basan en la #eneracin de observaciones independientes de una distribucin uniforme en V8,.W. ,l #enerador con#ruencial, propuesto por Le mer.., es uno de los ms utili$ados para obtener n*meros aleatorios uniformes. Una recomendacin muy extendida en la literatura es la de combinar varios #eneradores de n*meros aleatorios para obtener un #enerador con mejores caractersticas. Los m)todos de simulacin se denominan, de modo #eneral, t)cnicas de 9onte <arlo. ,stos m)todos se utili$an en la resolucin de diferentes problemas en los que la solucin analtica exacta es difcil de obtener o consume muc o tiempo. ,n esos casos, se busca una solucin aproximada mediante la simulacin. ,l t)rmino 9onte <arlo no ace referencia a un al#oritmo concreto de simulacin, sino ms bien al ec o de que se a aplicado un m)todo de ese tipo. Una aplicacin de estas t)cnicas se da, por ejemplo, en el campo de la inferencia. ,l procedimiento se puede describir, de modo #eneral, como si#ue= se ajusta un modelo a los datos empricos y se utili$a este modelo ajustado para simular muestras aleatorias que, a su ve$, se usan para estimar los parmetros de la distribucin terica. ,ste procedimiento #eneral se denomina bootstrap param)trico.

DISTRIBUCIONES DISCRETAS
Las distribuciones discretas incluidas en el submdulo de (:eneracin de distribuciones+ son= Uniforme discreta Ainomial 9ultinomial ?iper#eom)trica :eom)trica Ainomial Be#ativa Poisson

1E

<on excepcin de la multinomial, todas fueron descritas en el submdulo precedente !(<lculo de probabilidades+", de modo que a ora slo se explicar dic a distribucin.

Distribucin "ultinomial
:enerali$a la distribucin binomial al caso en que la poblacin se divida en mK1 #rupos mutuamente exclusivos y ex austivos. 0e supone un proceso estable y sin memoria que #enera elementos que pueden clasificarse en m clases distintas. 0upn#ase que se toma una muestra de n elementos y se definen m variables aleatorias 0iIn*mero de elementos de la clase i !iI., ..., m", entonces el vector de m2 variables es una variable aleatoria m2dimensional que si#ue una distribucin multinomial de parmetros n, p1, ..., pm, donde pi !iI., ..., m" es la probabilidad de la clase i. &)ase un ejemplo= de acuerdo con la teora de la #en)tica, un cierto cruce de conejillo de indias resultar en una descendencia roja, ne#ra y blanca en la relacin P=6=6. 0i se tienen P descendientes, el vector de variables !%., %1, %4" donde= %.I BZ de descendientes rojos %1I BZ de descendientes ne#ros %4I BZ de descendientes blancos si#ue una distribucin multinomial con parmetros nIP> p. I P@.E I 8,7> p1 I 6@.E I 8,17 y p4I 6@.E I 8,17. Una situacin muy com*n en la prctica se da cuando se conoce el tamaNo de muestra n y se quieren estimar las probabilidades pi a partir de los valores observados. Pero tambi)n ay situaciones en las que se debe estimar el tamaNo de muestra n, adems de las probabilidades pi. ,sto ocurre, por ejemplo, en el m)todo de captura2recaptura, que fue desarrollado por $olo#os para estimar poblaciones animales y que a sido aplicado a poblaciones umanas en estudios epidemiol#icos. Valores= xi I 8, ., 1, ... !i I ., ..., m" Parmetros= n= n*mero de pruebas, nK8 entero m= n*mero de clases, mK8 entero pi= probabilidad de la clase i, 8Lpi<1 !i-., ..., m", donde

i= 1

pi = 1 .

DISTRIBUCIONES CONTINUAS
Las distribuciones continuas incluidas en el mdulo de (:eneracin de distribuciones+ son= Uniforme Bormal Bormal bivariante Lo#normal Lo#stica Aeta
13

:amma ,xponencial Ti2cuadrado t de 0tudent U de 0nedecor

<on excepcin de la normal bivariante, todas fueron descritas en el submdulo precedente !(<lculo de probabilidades+", de modo que a ora slo se explicar dic a distribucin.

Distribucin Normal bi ariante


Uue introducida por :auss a principios del si#lo %'% en su estudio de errores de medida en las observaciones astronmicas y de clculo de rbitas de cuerpos celestes. <omo modelo de distribucin terico continuo, se adapta con #ran aproximacin a fenmenos reales en diversos campos de las ciencias sociales y la astronoma. De i#ual modo que la distribucin normal univariante est especificada por su media, *u, y su varian$a, +i,ma, la funcin de densidad de la variable aleatoria normal bivariante %I!%., %1", est determinada por el vector de medias *uI!*u1, *u2", el vector de desviaciones +i,maI!+i,ma1, +i,ma2" y el coeficiente de correlacin o entre las variables %. y %1. 0i las variables aleatorias %. y %1 son independientes, el coeficiente de correlacin lineal es nulo y por tanto oI8. (ampo %e )ariaci'n= 2 L x1 L 2 L x2 L Parmetros= *uI!*u1, *u2"= vector de medias, 2 L *u1 L , 2 L *u2 L +i,maI!+i,ma1, +i,ma2"= vector de desviaciones, +i,ma1 K8, +i,ma2 K8 o: coeficiente de correlacin, -1 o . 5qu, a diferencia de los restantes mdulos, no se pondrn ejemplos pues no tiene mayor sentido, ya que la estructura de las aplicaciones siempre es la misma. Bo obstante, para ilustrar la solucin de un problema prctico por va de la simulacin, se considera el si#uiente ejercicio en el que se aplica la distribucin normal bivariante. Ejercicio 0upon#a que la distribucin de la variable peso de una poblacin de jvenes si#ue una distribucin normal de media IE7 Q# y desviacin estndar I.7 Q#. 0upon#a, adems, que la variable altura en dic a poblacin si#ue una distribucin normal de media I.,EP m y desviacin estndar I8,18 m. La correlacin entre las dos variables es alta, de un 8,37. <on estos datos estimar el porcentaje de obesos en la poblacin teniendo en cuenta que la obesidad est definida por un ndice de masa corporal !'9<Ipeso@talla1" superior a 48 Q#@m1. Para calcular el porcentaje ay que simular los valores de la variable 3*(, pues no se dispone de la distribucin terica. Los pasos a se#uir sern los si#uientes= .. 0imular ..888 valores de la distribucin normal bivariante con los si#uientes parmetros= media y desviacin estndar del peso, media y desviacin estndar de la talla, y el coeficiente de correlacin entre la talla y el peso.

3. Llevar los valores de la variable simulada a una oja de clculo !por ejemplo" y
efectuar el cociente 3*(Ipeso@talla1.

3. <ontar el n*mero de valores de la variable 3*( que superan el umbral 48 Q#@m1


!condicin de obesidad".

1P

Jesultados con ,pidat 4..


@eneraci>n de distribuciones. Distribuciones continuas 3ormal biAar. (Mu,Bi:ma,;o) Mu : 0ector de medias 85, 1,81 Bi:ma : 0ector de desAiaciones estndar 15, ,) ;o : Coeficiente de correlaci>n ,65 0ector de medias 85, 1,81 Matri+ de dispersi>n ))5, ),)5 ),)5 , 7 <ama=o de la muestra ,ue se simula 0alores de la distribuci>n CCCCCCCCCCCCCCCCCCCCCCCCC 6), 65) 1,617) 1),17?? 1,15?7 5?,1)75 1,7))8 81,71# 1,1)6) I 1

<on los ..888 valores simulados se obtiene un porcentaje de sujetos con un 3*( superior a 48 Q#@m1 del OM. Notas: <ada ve$ que se reali$a una nueva simulacin se obtienen valores diferentes, aunque se manten#a la misma distribucin, el valor de sus parmetros y el tamaNo de la muestra.

BIBLIOGRAFA 1. -olmo#orov 5B. 4run%be,riffe %er 5a6rsc6einlic6tkeitsrec6nun,. Aerlin= 0prin#er2&erla#>


.O44. !/raducido al in#l)s= 9orrison B. 7oun%ations of t6e 86eor$ of Probabilit$. Be[ XorQ= < elsea> .O7E".

3. 9artn Plie#o UT, Jui$29aya L. 9sta%stica 3: Probabili%a%. 9adrid= ,ditorial 5<> .OO3. 3. 9eyer
PL. Probabili%a% 'beroamericana> .OPE. $ :plicaciones 9sta%sticas. 9)xico= 5ddison2Resley

6. PeNa D. *o%elos $ m;to%os# 1# 7un%amentos. 9adrid= 5lian$a Universidad /extos> .OO4. 7. -at$ DL. 9pi%emiolo,$, <iostatistics an% Pre)enti)e *e%icine <ompany> .OO3. e)ie=. U05= R.A. 0aunders

,. Dom)nec T9. *;to%os 9sta%sticos en (iencias %e la +alu%. Aarcelona= 0i#no> .OO3.


3. ?ospital Jamn y <ajal. 9aterial docente de la unidad de bioestadstica clnica. Disponible en= ttp=@@[[[. rc.es@bioest@9\docente. tml

1O

P. Ai##eri 5. Ne,ati)e <inomial >istribution. ,n= 5rmita#e P, <olton / editores. 9nc$clope%ia of <iostatistics# &ol. 6. < ic ester= To n Riley ] 0ons> .OOP. p. 1OE123. O. -emp 5R, -emp <D. :cci%ent Proneness. ,n= 5rmita#e P, <olton / editores. 9nc$clope%ia of <iostatistics# &ol. .. < ic ester= To n Riley ] 0ons> .OOP. p. 4723. .8. Palm#ren T. Poisson >istribution. ,n= 5rmita#e P, <olton / editores. 9nc$clope%ia of <iostatistics# &ol. 6. < ic ester= To n Riley ] 0ons> .OOP. p. 44OP24681. ... Le mer D?. *at6ematical met6o%s in lar,e-scale computin, units. ,n: Procee%in,s of t6e +econ% +$mposium on ?ar,e +cale >i,ital (omputin, @nits *ac6iner$. <ambrid#e, 9ass.= ?arvard University Press> .O7.. p. .6.2E.

48

También podría gustarte