Está en la página 1de 12

PRESENTACIN

Este documento pretende responder al propsito de contar con una especie de prontuario de la visualizacin grfica y de las principales caractersticas de algunas distribuciones de probabilidad continuas (densidades de probabilidad) en un mismo lugar. Se distinguen en l tres secciones dispuestas a manera de columnas: 1. La de la izquierda (primera columna) contiene dos grficos. El superior muestra varios ejemplos de la distribucin de probabilidades (pdf, por probability density function), en tanto que el inferior es la funcin de distribucin (cdf, por cumulative distribution function), graficada para los mismos casos de la distribucin de probabilidades. 2. En la seccin central se pueden ver, adems de la forma ms comn de definir la regla algebraica tanto de la pdf como de la cdf, otros valores y expresiones: parmetros, media, moda, mediana, varianza, coeficiente de sesgo [skewness], kurtosis [cuarto cumulant1 entre el cuadrado del segundo cumulant, cuenta que coincide con el cociente del cuarto momento central y el cuadrado de la varianza, menos 3], entropa [un indicador de la cantidad de informacin que proporciona una variable aleatoria], la funcin generatriz de momentos y la funcin caracterstica. 3. La seccin derecha contiene una serie de comentarios acerca de la distribucin, que tratan de redondear una mejor percepcin del comportamiento de la variable aleatoria correspondiente. Las dos primeras secciones (columnas) se han extraido del sitio en idioma ingls de Wikipedia (el de espaol no est tan completo como el de ingls) y la tercera es ma. Hay dos funciones especiales que aparecen en la definicin de algunas de las distribuciones: i. Funcin Gamma: ( x ) =

t x 1 e t dt , la que extiende el concepto de factorial a los nmeros complejos.Si la parte real del nmero complejo es
( x ) ( y) ( x + y)

positiva, entonces la integral converge totalmente. Propiedad: (k) = (k-1) (k-1), de aqu lo de factorial. ii. Funcin Beta: B ( x , y ) = 2

cos 2 x 1 ( ) sen 2 y 1 ( ) d = t x 1 (1 t ) y 1 dt =
0

, entre otras muchas ms formas equivalentes.

Las ltimas cuatro pginas resumen la familia de distribuciones Pearson y las dirigidas al anlisis de valores extremos. Espero que en al menos en una ocasin estas notas les resulten tiles. Ing. Carlos Manuel Prez Ramrez, M.I. Pachuca, Hgo., junio del 2008.
1

El n-simo cumulant se obtiene de la funcin generadora de Cumulants f ( t )


2 n tX

= ln[ E ( e )] = k r
r =1

tX

tr r!

= t +

t2 2

+ al valorar su n-sima derivada en cero:


itX

k1 = = f(0), k2 = = f(0), ..., kn = f (0). La esperanza E(e ) se conoce como funcin generatriz de momentos en tanto que E(e ) es la funcin caracterstica.

DISTRIBUCIN NORMAL
La distribucin Normal de probabilidades es importantsima por varias razones:
1) En parte debido al Teorema del Lmite Central, es un buen modelo de varios fenmenos cuantitativos que ocurren tanto en las ciencias naturales como en las de la conducta. 2) Es una buena aproximacin de mediciones en un amplio espectro de disciplinas: desde fenmenos sicolgicos hasta fsicos. 3) Tiene una relacin fundamental con el mtodo de estimacin conocido como Mnimos Cuadrados, de los ms simples y antiguos mtodos estadsticos. 4) Aparece en muchas reas de la Estadstica. Por ejemplo, la distribucin del promedio aritmtico de una muestra es aproximadamente Normal aunque la poblacin de la que procede cada dato no lo sea. 5) Muchas pruebas estadsticas estn basadas en la suposicin de normalidad. 6) Maximiza la entropa informativa (una medida de la incertidumbre asociada a una variable aleatoria, al cuantificar la informacin contenida en ella), entre todas las distribuciones con media y varianza conocidas.. 7) Es la distribucin lmite incluso de varias familias de distribuciones discretas.

DISTRIBUCIN LOGSTICA

Debe su nombre a que su funcin de distribucin (cdf) corresponde a la llamada funcin logstica:

Z( u ) =

eu 1+ eu

La funcin de densidad (pdf) se parece en forma a la Normal pero es un poco ms picuda (mayor kurtosis). Ha esultado til en diversos casos, entre ellos: 1) Ratings en algunos juegos. La Federacin Internacional de Ajedrez ha reemplazado la distribucin Normal por la Logstica en las frmulas que utiliza para ajustar las puntuaciones de los jugadores. 2) Biologa: desarrollo de la poblacin de especies en competencia. 3) Epidemiologa: en la descripcin de cmo se expande una epidemia. 4) Sicologa: descripcin del aprendizaje (curva de aprendizaje). 5) Tecnologa: cmo se difunde una nueva tecnologa y sustituye a otras. 6) Mercadotecnia: difusin de las ventas de nuevos productos. 7) Energa: difusin y sustitucin de fuentes de energa primarias. Cuando log(X) tiene una distribucin Logstica, entonces X tiene una densidad de probabilidades Log-Logstica.

DISTRIBUCIN GAMMA

Casos particularres de la densidad de probabilidades Gamma (no confundir con la funcin Gamma): 1) Cuando k=1 y =1/ entonces se obtiene la densidad de probabilidades Exponencial con parmetro . Obsrvese en el grfico a la izquierda y arriba la curva roja k=1, =2.

2) Cuando k=v/2 y =2 entonces se obtiene la densidad de probabilidades Chi-Cuadrada con v grados de libertad. Obsrvese en el grfico a la izquierda y arriba la curva verde k=2, =2, la cual es una Chi-Cuadrada con 4 grados de libertad. El estadgrafo de la primera prueba de bondad de ajuste de BestFit tiene, bajo la hiptesis nula, una densidad de probabilidades Chi-Cuadrada (y de ah su nombre). 3) Si k es un entero positivo, entonces se trata especficamente de una densidad de probabilidades Erlang, til para describir el tiempo transcurrido hasta el k-simo arribo en un sistema de espera de Poisson. 4) A medida que k aumenta la distribucin Gamma converge a la distribucin Normal 2 con media (k-1) y varianza (k-1) . 5) Si X es Gamma con parmetros y , y Y es Gamma con parmetros y , entonces X/(X+Y) es una variable aleatoria con densidad de probabilidades Beta de parmetros y . La distribucin Gamma es frecuentemente utilizada para modelar tiempos de espera (salidas eventuales de un artculo almacenado, por ejemplo).

DISTRIBUCIN BETA

DISTRIBUCIN TRIANGULAR

La distribucin de probabilidades Triangular est completamente acotada, es decir, su dominio es un intervalo cerrado real. Sus parmetros determinan totalmente si es simtrica (c = (a+b)/2) o asimtrica (y el sesgo puede ser a la izquierda o a la derecha). Estas caractersticas, muy fciles de manipular, hacen de la distribucin Triangular un magnfico modelo de un comportamiento aleatorio con alta incertidumbre, del que no se tengan registros histricos ya sea porque no se hayan realizado tales registros o porque simplemente se trate de algo que no ha ocurrido jams. Ejemplo de lo ltimo es lo que tiene que ver con contestar la pregunta: Si se realizara la inversin (de alrededor de quince millones de dlares) necesaria para poner en operacin un nuevo pozo petrolero, cul sera la produccin diaria? Cuando solamente se tenga la informacin suficiente para establecer tres estimaciones sobre el dominio de una variable: i) Una inferior, con una muy alta confianza de que no podr haber valores menores; ii) Una intermedia, alrededor de la cual se espere una alta concentracin de valores; y iii) Una superior, con una muy alta confianza de que no podr haber valores mayores, entonces un modelo prcticamente suficiente del comportamiento de la variable es la distribucin de probabilidades Triangular. Es til, entonces, en el anlisis de riesgo de proyectos de inversin y en el anlisis de un proyecto tipo PERT., aunque tambin se ha extendido su uso a otros aspectos de las finanzas corporativas y a un rea totalmente distinta: audio dithering, una forma intencionalmente aplicada de ruido para aleatorizar ciertos errores en el procesamiento final tanto de audio como de vdeo digitales.

DISTRIBUCIN WEIBULL

La kurtosis de la distribucin de probabilidades Weibull es:

en donde:
i i = (1 + k )

La funcin generatriz de momentos y la funcin caracterstica tienen expresiones especiales que considero que es mejor no incluir aqu. En particular, si k=1, entonces se reduce a la distribucin Exponencial; y cuando k=3.4 la distribucin de Weibull imita bastante bien a la distribucin Normal. La distribucin de Weibull tiene variadas aplicaciones, entre otras: 1. En el Anlisis de Supervivencia, que estudia el tiempo de vida de organismos biolgicos y de fallas en sistemas mecnicos (teora de confiabilidad). Cuestiones similares pueden ser modeladas en otros campos (como la economa y la sociologa) y en eventos recurrentes (una persona puede ir a la crcel, o divorciarse, varias veces). 2. Para representar tiempos de manufactura o de entrega de productos. 3. Modelar el comportamiento de valores extremos (los que ocurren rara vez). 4. En el rea de la actuara: seguros de automviles, casas, ... (pero no de vida). 5. Comunicaciones inalmbricas: modelado de la distorsin de seales. 6. Modelado de la dispersin de seales en sistemas de radares.

DISTRIBUCIN RAYLEIGH

jLa funcin de error (erf) que aparece en la funcin generatriz de momentos es:

En la funcin caracterstica aparece erfi: la equivalente funcin de error compleja. El estimador de mxima verosimilitud del nico 2 parmetro, , de la distribucin de Rayleigh est dado por:

1 2n

x
i =1

2 i

Aparece en situaciones en que interesa una variable relacionada con dos variables Normales independientes de igual varianza. Sirve para modelar, por ejemplo, la velocidad del viento o el efecto del ambiente de propagacin sobre una seal de radio (como el usado por dispositivos inalmbricos).

LA FAMILIA DE DISTRIBUCIONES PEARSON



Cuando se dice distribucin Pearson, en realidad no se refiere a una distribucin especfica sino a alguna distribucin de probabilidades continua que satisface las caractersticas del sistema originalmente diseado por Karl Pearson (el mismo de la prueba de bondad de ajuste Chi-Cuadrada y del coeficiente de correlacin lineal) para modelar observaciones notoriamente sesgadasen el campo de la Bioestadstica. El trabajo de Pearson fue publicado por primera vez en 1895 y corregido y aumentado por l mismo despus, en publicaciones de1901 y 1916. Los tipos de distribuciones de Pearson son caracterizados por dos parmetros: 1 y 2, definidos respectivamente como el cuadrado del coeficiente de sesgo y el segundo como la kurtosis antigua (el cuarto momento central entre el cuadrado de la varianza, sin restar el 3 de la kurtosis moderna o excess kurtosis referida en la segunda columna de las distribuciones descritas en este documento). En general, una distribucin de probabilidades continua pertenece a alguno de los tipos de la familia Pearson si resulta ser una solucin vlida a la ecuacin diferencial:

en la que:

Como se trata de una ecuacin diferencial lineal con coeficientes variable s, su solucin es inmediata:

p( x ) = R e

b 0 + b1 x + b 2 x 2

x a

dx

R es una constante que asegura que p(x) es una distribucin de probabilidades. Dependiendo de si el discriminante de la ecuacin de segundo grado es o no negativo, y de los valores especficos de a, b0, b1 y b2, se obtienen siete tipos de distribuciones Pearson.

La tabla ejemplifica el tipo de distribucin Pearson al que pertenecen algunas distribuciones de probabilidad ya descritas, o relacionadas con ellas. Discriminante Negativo Pearson Tipo IV VII (caso simtrico de la tipo IV) I II (caso simtrico de la tipo I) III V VI Distribuciones que pertenecen al tipo Ninguna Normal, t-Student, Cauchy Beta, Normal (como lmite) aprox. t-Student Gamma, Chi-Cuadrada, Normal Gamma Inversa, Normal F-Fisher, Normal

Positivo

En la siguiente pgina se insertan dos grficas: una que mediante reas coloreadas muestra las combinaciones de valores 1 y 2 que dan lugar a diferentes tipos de distribuciones Pearson.

10

DISTRIBUCIN DE VALORES EXTREMOS



En algunas ocasiones lo que interesa es la caracterizacin de los valores mnimos o mximos de un comportamiento aleatorio y no ste como tal. Por ejemplo, en el nivel de atencin de los clientes de un banco podramos estar interesados en disminuir el tiempo mximo en cola y no precisamente el tiempo que un cliente hace cola. Diariamente (o en los das de mayor actividad) registraramos algunos tiempos en cola de los clientes y, de la muestra recogida, obtener el mximo dato. Al cabo de varios das dispondramos de una muestra que nos permitira analizar el comportamiento aleatorio de el tiempo mximo en cola. La distribucin de probabilidades de ste podra ser ajustada por alguna de las distribuciones de valores extremos sugeridas aqu. Las reas de aplicacin son variadas: 1) Grandes olas en altamar (por sus efectos desastrosos en buques, plataformas petroleras, gnesis de tsunamis, ...); 2) Riesgos de mercado (grandes variaciones en el precio de las acciones, en las tasas de inters, en el tipo de cambio, en el precio de los satisfactores, en el costo del crdito, etc.); 3) Grandes inundaciones y otros desastres naturales; 4) Notorios cambios (mutaciones) en la evolucin biolgica, 5) Negocio de los seguros (riesgo de grandes prdidas por el pago de daos). El estudio de la distribucin de probabilidades de valores extremos est enmarcado en la teora del Valor Extremo, iniciada por Emil Julius Gumbel en la dcada de los 50s. Las distribuciones de probabilidad de valores extremos constituyen una familia de distribuciones, que comprende a su vez a las familias de distribuciones de Gumbel (que resulta ser un caso especial de la familia de distribuciones de Fisher-Tippett), de Frchet y de Weibull, conocidas como destribucin de valores estremos de tipo I, II y III, respectivamente. La funcin de distribucin (cdf) y la densidad de probabilidades (pdf) de valores extremos tienen los modelos algebaicos siguientes:

F( x ; , , ) = e
Consecuentemente, la densidad de probabilidades est dada por:

x 1+

1 /

para 1+(x-)/ > 0, en donde real es el parmetro de localizacin, > 0 el de escala y real el de forma.

1 x f ( x ; , , ) = 1 +

1 / 1

x 1+

1 /

En la prxima pgina se da el perfil general de la familia de distribuciones de valor extremo y en particular las caractersticas de la familia de distribuciones de Fisher-Tippett.

12