Está en la página 1de 12

!

"#$#%&'()*%
1

Este documento pretende responder al propsito de contar con una especie de prontuario de la visualizacin grfica y de las principales caractersticas de algunas
distribuciones de probabilidad continuas (densidades de probabilidad) en un mismo lugar.
Se distinguen en l tres secciones dispuestas a manera de columnas:
1. La de la izquierda (primera columna) contiene dos grficos. El superior muestra varios ejemplos de la distribucin de probabilidades (pdf, por
probability density function), en tanto que el inferior es la funcin de distribucin (cdf, por cumulative distribution function), graficada para los mismos
casos de la distribucin de probabilidades.
2. En la seccin central se pueden ver, adems de la forma ms comn de definir la regla algebraica tanto de la pdf como de la cdf, otros valores y
expresiones: parmetros, media, moda, mediana, varianza, coeficiente de sesgo [skewness], kurtosis [cuarto cumulant
1
entre el cuadrado del segundo
cumulant, cuenta que coincide con el cociente del cuarto momento central y el cuadrado de la varianza, menos 3], entropa [un indicador de la cantidad
de informacin que proporciona una variable aleatoria], la funcin generatriz de momentos y la funcin caracterstica.
3. La seccin derecha contiene una serie de comentarios acerca de la distribucin, que tratan de redondear una mejor percepcin del comportamiento de la
variable aleatoria correspondiente.
Las dos primeras secciones (columnas) se han extraido del sitio en idioma ingls de Wikipedia (el de espaol no est tan completo como el de ingls) y la tercera es ma.
Hay dos funciones especiales que aparecen en la definicin de algunas de las distribuciones:
i. Funcin Gamma:
!
"
# #
= $
0
t 1 x
dt e t ) x ( , la que extiende el concepto de factorial a los nmeros complejos.Si la parte real del nmero complejo es
positiva, entonces la integral converge totalmente. Propiedad: !(k) = (k-1) !(k-1), de aqu lo de factorial.
ii. Funcin Beta:
! !
+ "
" "
= # = =
# # # #
2
0
1
0
1 y 1 x 1 y 2 1 x 2
) y x (
) y ( ) x (
dt ) t 1 ( t d ) ( sen ) ( cos 2 ) y , x ( B
!
" " " , entre otras muchas ms formas equivalentes.
Las ltimas cuatro pginas resumen la familia de distribuciones Pearson y las dirigidas al anlisis de valores extremos. Espero que en al menos en una
ocasin estas notas les resulten tiles.

Ing. Carlos Manuel Prez Ramrez, M.I.
Pachuca, Hgo., junio del 2008.


1
Ll !"eslmo ,-.-/012 se obLlene de la !"#$%&# ()#)*+,-*+ ,) ."/"0+#12
!
"
=
+ + = = =
1 r
2
2
r
r
tX
2
t
t
! r
t
k )] e ( E ln[ ) t ( f ! ! al valorar su !-eslma derlvada en cero:
k
1
= = f'(0), k
2
= "
2
= f''(0), ..., k
n
= f
n
(0). La esperanza L(e
Lx
) se conoce como #$!%&'! )*!*+,-+&. /* 010*!-12 en LanLo que L(e
lLx
) es la #$!%&'! %,+,%-*+32-&%,.
3)$&")45()*% %6"7'8

2

































La dlsLrlbucln normal de probabllldades es
lmporLanLlslma por varlas razones:
1) En parte debido al Teorema del Lmite
Central, es un buen modelo de varios fen-
menos cuantitativos que ocurren tanto en las
ciencias naturales como en las de la con-
ducta.
2) Es una buena aproximacin de mediciones
en un amplio espectro de disciplinas: desde
fenmenos sicolgicos hasta fsicos.
3) Tiene una relacin fundamental con el
mtodo de estimacin conocido como Mni-
mos Cuadrados, de los ms simples y anti-
guos mtodos estadsticos.
4) Aparece en muchas reas de la Estadsti-
ca. Por ejemplo, la distribucin del promedio
aritmtico de una muestra es aproximada-
mente Normal aunque la poblacin de la que
procede cada dato no lo sea.
5) Muchas pruebas estadsticas estn basa-
das en la suposicin de normalidad.
6) Maximiza la entropa informativa (una
medida de la incertidumbre asociada a una
variable aleatoria, al cuantificar la informa-
cin contenida en ella), entre todas las dis-
tribuciones con media y varianza conocidas..
7) Es la distribucin lmite incluso de varias
familias de distribuciones discretas.

3)$&")45()*% 869:$&)('

3


































Debe su nombre a que su funcin de
distribucin (cdf) corresponde a la llamada
funcin logstica:

u
u
e 1
e
) u ( Z
+
=
La funcin de densidad (pdf) se parece en
forma a la Normal pero es un poco ms pi-
cuda (mayor kurtosis).
Ha esultado til en diversos casos, entre
ellos:
1) Ratings en algunos juegos. La Federa-
cin Internacional de Ajedrez ha reemplaza-
do la distribucin Normal por la Logstica en
las frmulas que utiliza para ajustar las pun-
tuaciones de los jugadores.
2) Biologa: desarrollo de la poblacin de
especies en competencia.
3) Epidemiologa: en la descripcin de cmo
se expande una epidemia.
4) Sicologa: descripcin del aprendizaje (cur-
va de aprendizaje).
5) Tecnologa: cmo se difunde una nueva
tecnologa y sustituye a otras.
6) Mercadotecnia: difusin de las ventas de
nuevos productos.
7) Energa: difusin y sustitucin de fuentes
de energa primarias.
Cuando log(X) tiene una distribucin Logsti-
ca, entonces X tiene una densidad de proba-
bilidades Log-Logstica.
3)$&")45()*% 9'77'

4



































Casos particularres de la densidad de proba-
bilidades Gamma (no confundlr con la
#$!%&'! 4,00,):
1) Cuando k=1 y #=1/$ entonces se obtiene la
densidad de probabilidades Exponencial con
parmetro $. Obsrvese en el grfico a la
izquierda y arriba la curva roja k=1, #=2.
2) Cuando k=v/2 y #=2 entonces se obtiene la
densidad de probabilidades Chi-Cuadrada
con v grados de libertad. Obsrvese en el
grfico a la izquierda y arriba la curva verde
k=2, #=2, la cual es una Chi-Cuadrada con 4
grados de libertad. El estadgrafo de la pri-
mera prueba de bondad de ajuste de BestFit
tiene, bajo la hiptesis nula, una densidad
de probabilidades Chi-Cuadrada (y de ah su
nombre).
3) Si k es un entero positivo, entonces se
trata especficamente de una densidad de
probabilidades Erlang, til para describir el
tiempo transcurrido hasta el k-simo arribo
en un sistema de espera de Poisson.
4) A medida que k aumenta la distribucin
Gamma converge a la distribucin Normal
con media (k-1)# y varianza (k-1)#
2
.
5) Si X es Gamma con parmetros % y #, y Y
es Gamma con parmetros & y #, entonces
X/(X+Y) es una variable aleatoria con densi-
dad de probabilidades Beta de parmetros %
y &.
La distribucin Gamma es frecuentemente
utilizada para modelar tiempos de espera
(salidas eventuales de un artculo almacena-
do, por ejemplo).
3)$&")45()*% 4#&'

3



































Ntese, a diferencia de las anteriores, que
la variable aleatoria Beta toma valores en
el intervalo de cero a uno.
La cdf es I
x
(%, &), conocida como la fun-
cin Beta Regularizada, que es el cocien-
te de la funcin Beta incompleta y la com-
pleta.
La funcin Beta Incompleta est dada por:



La Kurtosis est dada por:



La entropa tiene una expresin que con-
tiene a la funcin Digamma (derivada lo-
gartmica de la funcin Gamma) que ya no
viene al caso definir.

La densidad de probabilidades Beta pue-
de ser utilizada para modelar eventos res-
tringidos a estar entre una estimacin m-
nima y otra mxima. Por esta razn es
ampliamente usada, junto con la densidad
Triangular, en el rea de administracin
de proyectos tipo PERT para describir el
tiempo de ejecucin de cada tarea.

3)$&")45()*% &")'%958'"

6







































La distribucin de probabilidades Triangular est com-
pletamente acotada, es decir, su dominio es un interva-
lo cerrado real.
Sus parmetros determinan totalmente si es simtrica
(c = (a+b)/2) o asimtrica (y el sesgo puede ser a la
izquierda o a la derecha).
Estas caractersticas, muy fciles de manipular, hacen
de la distribucin Triangular un magnfico modelo de un
comportamiento aleatorio con alta incertidumbre, del
que no se tengan registros histricos ya sea porque no
se hayan realizado tales registros o porque simplemen-
te se trate de algo que no ha ocurrido jams. Ejemplo
de lo ltimo es lo que tiene que ver con contestar la
pregunta: Si se realizara la inversin (de
alrededor de quince millones de dlares)
necesaria para poner en operacin un nue-
vo pozo petrolero, cul sera la produc-
cin diaria?
Cuando solamente se tenga la informacin suficiente
para establecer tres estimaciones sobre el dominio de
una variable: i) Una inferior, con una muy alta confianza
de que no podr haber valores menores; ii) Una inter-
media, alrededor de la cual se espere una alta concen-
tracin de valores; y iii) Una superior, con una muy alta
confianza de que no podr haber valores mayores, en-
tonces un modelo prcticamente suficiente del compor-
tamiento de la variable es la distribucin de probabilida-
des Triangular.
Es til, entonces, en el anlisis de riesgo de proyectos
de inversin y en el anlisis de un proyecto tipo PERT.,
aunque tambin se ha extendido su uso a otros aspec-
tos de las finanzas corporativas y a un rea totalmente
distinta: audio dithering, una forma intencionalmente
aplicada de ruido para aleatorizar ciertos errores en el
procesamiento final tanto de audio como de vdeo digi-
tales.
3)$&")45()*% ;#)4588

7









































La kurtosis de la distribucin de probabilidades
Weibull es:

en donde:
) 1 (
k
i
i
+ ! = !
La funcin generatriz de momentos y la funcin
caracterstica tienen expresiones especiales
que considero que es mejor no incluir aqu.
En particular, si k=1, entonces se reduce a la
distribucin Exponencial; y cuando k=3.4 la
distribucin de Weibull imita bastante bien a la
distribucin Normal.
La distribucin de Weibull tiene variadas apli-
caciones, entre otras:
1. En el Anlisis de Supervivencia, que estu-
dia el tiempo de vida de organismos biolgi-
cos y de fallas en sistemas mecnicos (teora
de confiabilidad). Cuestiones similares pue-
den ser modeladas en otros campos (como
la economa y la sociologa) y en eventos re-
currentes (una persona puede ir a la crcel, o
divorciarse, varias veces).
2. Para representar tiempos de manufactura o
de entrega de productos.
3. Modelar el comportamiento de valores ex-
tremos (los que ocurren rara vez).
4. En el rea de la actuara: seguros de au-
tomviles, casas, ... (pero no de vida).
5. Comunicaciones inalmbricas: modelado
de la distorsin de seales.
6. Modelado de la dispersin de seales en
sistemas de radares.
3)$&")45()*% "'<8#)9=

8








































jLa funcin de error (erf) que aparece en la fun-
cin generatriz de momentos es:

En la funcin caracterstica aparece erfi: la
equivalente funcin de error compleja.
El estimador de mxima verosimilitud del nico
parmetro, "
2
, de la distribucin de Rayleigh est
dado por:
!
=
=
n
1 i
2
i
2
x
n 2
1
!
Aparece en situaciones en que interesa una va-
riable relacionada con dos variables Normales
independientes de igual varianza.
Sirve para modelar, por ejemplo, la velocidad del
viento o el efecto del ambiente de propagacin
sobre una seal de radio (como el usado por dis-
positivos inalmbricos).
8' >'7)8)' 3# 3)$&")45()6%#$ !#'"$6%

Cuando se dice distribucin Pearson, en realidad no se refiere a una distribucin especfica sino a alguna distribucin de probabilidades continua que satisface las
caractersticas del sistema originalmente diseado por Karl Pearson (el mismo de la prueba de bondad de ajuste Chi-Cuadrada y del coeficiente de correlacin lineal)
para modelar observaciones notoriamente sesgadasen el campo de la Bioestadstica. El trabajo de Pearson fue publicado por primera vez en 1895 y corregido y au-
mentado por l mismo despus, en publicaciones de1901 y 1916.
Los tipos de distribuciones de Pearson son caracterizados por dos parmetros: &
1
y &
2
, definidos respectivamente como el cuadrado del coeficiente de sesgo y
el segundo como la kurtosis antigua (el cuarto momento central entre el cuadrado de la varianza, sin restar el 3 de la kurtosis moderna o excess kurtosis referida en la
segunda columna de las distribuciones descritas en este documento).
En general, una distribucin de probabilidades continua pertenece a alguno de los tipos de la familia Pearson si resulta ser una solucin vlida a la ecuacin
diferencial:




en la que:



Como se trata de una ecuacin diferencial lineal con coeficientes variable s, su solucin es inmediata:





La tabla ejemplifica el tipo de distribucin Pearson al que pertenecen algunas distribuciones de probabilidad ya descritas, o relacionadas con ellas.
Discriminante Pearson Tipo Distribuciones que pertenecen al tipo
Negativo
IV Ninguna
VII (caso simtrico de la tipo IV) Normal, t-Student, Cauchy
Positivo
I Beta, Normal (como lmite)
II (caso simtrico de la tipo I) aprox. t-Student
III Gamma, Chi-Cuadrada, Normal
V Gamma Inversa, Normal
VI F-Fisher, Normal
En la siguiente pgina se insertan dos grficas: una que mediante reas coloreadas muestra las combinaciones de valores &
1
y &
2
que dan lugar a diferentes tipos de
distribuciones Pearson.



dx
x b x b b
a x
2
2 1 0
e R ) x ( p
!
=
+ +
"
"
" es una consLanLe que asegura que p(x) es una dlsLrlbucln de probabllldades.
uependlendo de sl el dlscrlmlnanLe de la ecuacln de segundo grado es o no negaLlvo, y de los valores
especlflcos de 0, ?
@
, ?
A
y ?
B
, se obLlenen sleLe Llpos de dlsLrlbuclones earson.

10








































3)$&")45()*% 3# C'86"#$ #D&"#76$

En algunas ocasiones lo que interesa es la caracterizacin de los valores mnimos o mximos de un comportamiento aleatorio y no ste como tal. Por ejemplo, en el
nivel de atencin de los clientes de un banco podramos estar interesados en disminuir el tiempo mximo en cola y no precisamente el tiempo que un cliente hace cola.
Diariamente (o en los das de mayor actividad) registraramos algunos tiempos en cola de los clientes y, de la muestra recogida, obtener el mximo dato. Al cabo de
varios das dispondramos de una muestra que nos permitira analizar el comportamiento aleatorio de el tiempo mximo en cola. La distribucin de probabilidades de
ste podra ser ajustada por alguna de las distribuciones de valores extremos sugeridas aqu.
Las reas de aplicacin son variadas: 1) Grandes olas en altamar (por sus efectos desastrosos en buques, plataformas petroleras, gnesis de tsunamis, ...);
2) Riesgos de mercado (grandes variaciones en el precio de las acciones, en las tasas de inters, en el tipo de cambio, en el precio de los satisfactores, en el costo del
crdito, etc.); 3) Grandes inundaciones y otros desastres naturales; 4) Notorios cambios (mutaciones) en la evolucin biolgica, 5) Negocio de los seguros (riesgo de
grandes prdidas por el pago de daos).
El estudio de la distribucin de probabilidades de valores extremos est enmarcado en la teora del Valor Extremo, iniciada por Emil Julius Gumbel en la dca-
da de los 50s.
Las distribuciones de probabilidad de valores extremos constituyen una familia de distribuciones, que comprende a su vez a las familias de distribuciones de
Gumbel (que resulta ser un caso especial de la familia de distribuciones de Fisher-Tippett), de Frchet y de Weibull, conocidas como destribucin de valores estremos
de tipo I, II y III, respectivamente.
La funcin de distribucin (cdf) y la densidad de probabilidades (pdf) de valores extremos tienen los modelos algebaicos siguientes:








para 1+'(x-)/" > 0, en donde real es el parmetro de localizacin, " > 0 el de escala y ' real el de forma.
Consecuentemente, la densidad de probabilidades est dada por:









En la prxima pgina se da el perfil general de la familia de distribuciones de valor extremo y en particular las caractersticas de la familia de distribuciones de
Fisher-Tippett.
!
"

!
! "
/ 1
x
1
e ) , , ; x ( F
!
"
"
#
$
%
%
&
'
(
(
)
*
+
+
,
- !
+ !
=
!
"

!
!
"

!
"
! "
/ 1
x
1
1 / 1
e
x
1
1
) , , ; x ( f
!
"
"
#
$
%
%
&
'
(
(
)
*
+
+
,
- !
+ !
! !
"
"
#
$
%
%
&
'
(
(
)
*
+
+
,
- !
+ =

12

También podría gustarte