Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Distribució Lognormal PDF
Distribució Lognormal PDF
de la distribucin lognormal
por F. AZ^RIN y M. J. PALACIOS
Departamento de Estadstica. Facultad de Ciencias
Unlversidad Autnoma de Madrid
o.
INTRODUCCION
1.
Se dice que una variable aleatoria tiene distribuci^n lognormal o logartmiconormal cuando su transformada logartmica (o, rns generalmente, la transformacin lflgartmica de una transformacin lineal de la variable original) tiene una
distribucin normal. En el caso ms simple, que es el que se considera en este
apartadb, se dice que la variable X es logn^ormal si la funcin de densidad de su
transformada logartmica Y! log X, es la normal N(, a-):
BSTADISTIGA E.SPAlYO].A
-.
para
[ i.il
cr ti1 2 rr
x E (0, ^)
[ 1.2]
cr ^ 2 >t
Abreviadarnente se dice que ]a variable X es L(,^, ^rl y su trans^formada, Y,
N (x, +rr^-
2.
[2.i1
Por tanio, para t- r el momento r-simo ordinario de X tque de ahora en adelante se dotar^, de subndice para evitar confusiones con el de la normal), ser:
ar fx . = E (X r) = ^v (r)
Por otra parte, a1 ser ^ la funcin generatriz de una variable N(a, cr):
^v (t^ - exp (oc t + t^ ^-$^2j
verific^x,
b lo^; = eiog ^
log, x=
log. x
log. e
loglo e
(`'l
_
! 0,43429...
_(log, x) ilog. b)
[ 2.2 ^
[ 2.4 ]
el coeflciente de asimetra
! (exp
y el de curtosis
lu^.z
^ `2,9c -
^s
^Tr Ja.t!
fL (L/,) (^ l.^ _=
fN (V) G^ V
es decir:
lo,g rr ^a, x-^r J^, ,J
o bien
(^r ^ ^. 1/)
En particular, la mediana ^C^,,^ = exp (e, U) = exp (x^, por ser mediana
media
La mda se o?atendr al igualar a cero la derivad^a primera de la funcin de densidad [ 1.31, resultando
,
ud, s--- exp a-- cT`)
83TADISTICA ESPAOI..A
[2.51
[2.61
[ 2.? )
[2.81
[2.9)
[Z.io^
3.
EST"IMACI4N Y AJIJSTE
La media rnuestral, esto es, la media de las observaciones obtenidas con una
muestra aleatoria simple es un estimador insesgado de la media terica de la
variable en estudio en la poblacin de procedencia. Designando por X esta variable, el estimador insesgado de la media ser^
_ ^ xt^n
[3.11
i=2, n
y el de la varianza cTx
^ _ ^i ^xt - a ^^^^ln,
f^l, tt
-- 1^
[3.21
^ log x,^n
tal. w
[3.31
-y = ^ (log xi -- x^}2^(rL - 1^
[3.41
^n (2 v-^ ^ -- t^i'n
n--2
n -- 1
c:r^
[3.61
donde los valores de ^n estn tabulados en las obras antes citadas. Dichos valores
aumentan con Q-^ y con el tamao muestral, n;
aproximadamente igual a la funcin exponencial, con lo que se conservan las relaciones [2.31 y[2.41. Por ejemplo, para n - 2 y ^-^ --^ 0,1 es ^n = 1,025, y para n= 50
y ^2 = 4 es ^n = 6,628.
Si se parte de observaciones agrupadas en clases (loglo xi_1, logl xi) i= 1, ..., m.,
con ni observa^ciones en dicha clas^e, se puede tomar como estimador de la media
de los logaritmos :
2,30258, . . .,
z _
^ n^ logt^ x^
-^ 1. ^n
^,
^ ni
[ 3.7 ]
i=1, m
^ry ^
,
^ ni - 1
[ 3.81
i.--1, m
Pueden vers^e varaios mtodbs de estimacin y aj uste y comparacic^n de resultados en Aitchison y Brown y en Koch y Link; los primeros recorniendan, para
^,.
B.SiTADISTICA ESPAOLA
l0
4.
log x -- a
^-
[4.11
^^ _ ^-^ [F (x)^
[4.21
2. Un e^ e de ordenadas aritmtico en >> _^^-1 [ F(x):) y tambin con d^oble escala, la segunda correspondiente a F(x^ _^(rj).
(3) Varios ejeniplos de aplicacin del papel pr^babilstico a problemas relacionados con la dis1.rbucn Iognormal pueden v^srse en G. CAr.aT (pp. 193 y ss.) y Kocx y LiNK (pp. 23? y as.).
lI
el
eje
Qr^
Dada una distribucin emprica xI, x.,, ..., x,^, con frecuencias relativas n,/N, ...,
n^/N, N-
^+... + n{ .
N
Si la d^istribucin est agrupada en intervalos a^ --- a,, aI -- a y, ..., a,^_ 1 -- a,^, con
frecuencias r^f/N, los puntos a representar ser.n (ai, Fi), i- 1, h, donde, como en eI
caso anterior, F{ - F (a{).
Si los puntos as representados se alinean sensiblemente, segn una recta que
sera la ^=(,^ -- a)/o-, se podr aceptar con este criterio grfico que la distribucin
emprica es lognormai y sus par,metros podr^.n estimarse como a continuacin se
indica.
b)
ESTIMACIN DS a T cr
siendo
por tanto, si x* * es
x* y x**
tales
que
Como dice G. Calot, es^tas estimaciones pueden ser ms precisas que las analticas por no estar afectadas del error d^ agrupamiento en clases; sin embargo, hay
que tener en cuenta que ajustar una recta a los puntos (a,, F^), i.- 1, h, tambin
puede conllevar un error subj etivo.
C)
C^BSERVACIONES
SOIIRE LOS
INTERVALOS
DE PROBABILIDAD
PREPTJADA
BSTADISTICA ESPAOLA
12
para la distribucin lognormal sern exp (x --,^ cr), exp {^ -^t ^r) y, por tanto, no
centrados en media ni ta.n siquiera en mediana.
Por otra parte, si X es L(a, cr}, entonces el valor x^. tal que P ( X > xt) - E puede
obtenerse para e^ 1/2, de xe - exp (ac + crh,^), siendo ^.^ tal que:
P{^Z^>^.^) .- e
dond^e Z es N (0,1};
s.
dnde
,^^,? = E(Xa)
6.
donde
A = 0,675 ...
Puesto que combina^ciones lineales de variables aleatorias independientes distribuidas normalmente dan lugar a variables con distribucin normal, se verificar:
Si X,, XZ, ..., Xn son variables aleatorias independientes con dis^tribucin L(^,^, v-k},
k= 1, n, y hl, h^, .. ., h sfln nmeros enteros, entonces la variable aleatoria Y= xhl,
^
Xh', ..., Xh'^ tiene distribucin L(^c, cr) donde
^c = II h^: _^,
k=1, n
En particular:
1.
13
2.
7.
en donde ^ es un parmetro real y X>/^ , se tiene la funcin de densidad lognarmal de tres parmetros :
f (x) -
1
(x - ^) ^ ^2^
exp(
i
en particular, la media
x^. r=/^ -#- exp (^ + v-^^/2)
17.11
^^+exp (x-^-cr^=/2)
^
J_^
las cuantilas
^ ^,)
;, r,s, ^. _ ^3 -t- exp ,.,^,
y en particular, la mediana
lar moda
u^. :^ = /^ + eXp (^ ^ ^` 1
[ 7.21
gsr^,nisric^ Esp^O^
19
y el coeficiente de asimetra
^i. Z = (2 + exp c^-'l) ^eXp
,I^^;^}u
Estas relaciones dan lugar a otra.s, inversas de ellas, y que se indican a continuacin:
1
^c - 21og (^i,,^ -- ^ ` 2 l^g ^x^,: -- a 1^ ai. ^ + 1^)
^ log ^. `^3:+.x
og ^ 1 +
^3^*, x
^ Z ?i ^ f^
^r = 1^ log (rr
^
3!4, r
[?.3]
r/J
[?.41
[ ?.5 ]
A, = 0,675 ...
[?.6]
[7.7^
Esta ltima expresin tiene inters, ya que permite una aproximacin no demasiado complicada, adems de ser la nica analtica, del tercer parmetro de la
distrik^ucin lognorznal.
En cuanto al empleo de la distribucin lognorrnal de tres par^,metros en algunas aplicacivnes concretas, deben tomarse especiales precauciones por las dificultades en estimar ^3 cuando la muestra es pequea. En general, una subestimacin
de ^ Ileva a varios sesgos en la estimacin de la media (Koch y Link), pero s^u
sobreestimacin puede dar lugar a lmites de confianza demasiado prximos, por
ser demasiado pequea la varianza de los logaritmos.
8.
[8.1 ]
resulta que, segn que ^(3 sea conocido o no, se podr realizar una transformacin
sobre el sistema de coordenadas para que la curva 18.1 ] se convierta o no en
una recta.
15
= log (x - ^3)
C8.21
y se mantienen ias consideraciones de la seccin 4, con slo repres^entar los puntos x^ -- ^3 (h = 1, n) en el eje de abscisas. Resultando como estimacin de z y cr,
respectivamente:
log
x* *
x*
log
x" --- ^3
x'-^
/3 > 0.
`
La,
todo
valor
,=
^! asintotas vertical y oblicua, respectfvamente.
J
^r
FIGURA 1
FIGURA 2
16
LSTADISTICA ESPAOL^^
ahora,
,^ ^= log x'
por tanto:
,^ -- x" - x^
y sta ser una forma de estimacin de ,^3 (vanse figuras 1 y 2).
E1 problema prctico consiste en determinar la asntota oblicua; ello puede
hacerse eligiendo una recta tal que la desviacin horizontal entre la curva y ella
se mantenga, aproximadamente, conytante cuando es medida en antiiogaritmos, y
comprobando despus que ^ = log /3 0^^ _[log (- ^3) - x^/^- es asfntota vertical u
horizontal, respectivamente, para ^3 > 0 0^3 < 0 t5).
9.
[ 9.11
^a
e X p^
3+ 3,, 1 o
x-
-^^ 2 v-''
j
l,^
3 ^. g( ^1) ^/ ,
x^
(/^^
lNl^
^ao j
I
cr ^/ 2 ^t (x - %31^
^^ y r
^^'
r r
-' ^ ^-, x - (1) 1^1 ^,^-1. .r + . . . -}-
1 r r
- ) ^Q i
LA DiSTRIBUGION LAGNOR!tiiAL
1^
y la varianza
^r^-' -- [exp (2 ^c -1- cJ-^}l^ ^^ ( eXP (_`" ^.^`^/,^^7) ^ 1.^
1
cr ^ 2 7t (^3 - x^
exp
x E {-- a^, ^)
l0.
P4SIBLES
tlo.ll
Esta es la llamada teora del efecto proporcional, que fue forrnulada por Kapteyn
en 1903, y en la que se supone que las et son variables aleatorias independientes
(frecuentemente se suponen tambin con igual distribucinl, y que L1 X es una
proporcin aleatoria del valor anterior de la variable. (Vase Aitchison y Brown,
as como Agterberg.)
Casos particulares importantes de [ 10.1 ] son :
a1
^
^
h sl , i
ESTADISTICA BSPAOI.A.-2
xh -- xn-i
x^h-^
- ^ ^n
1t-1, fi
1$
$sTADsTCA FSPAIiQ1.A
dx
x
i log Xt - log X^
o bien
1g Xt = log Xn -}- ^ ei
^.^^. ^
segn lo cual la distribucin asinttica de X, es la lognormal.
11.
gran inters, pero que no corresponde ahora considerar. Conviene insistir en que
la transfarmacin logartmica de dos parmetros aplicada a estos datos no es siempre la mejor entre las distribuciones asimtricas. Adems de la distribucin lognormal de tres par,metros, que supone sumar una constante a todos los datos,
pueden ajustarse otras distribuciones asimtricas como las mencionadas en la
seccin 1.
(s) Como el contenido de oro de las menas suele ser pequeo, los valor3s de la variable empleada
sa expresan en dwt/short ton (el significado es dwt ^ penny weight); un depsito con una onza de
oro por ton^slada contiene 34 partes de oro por un milln, esto es 34 gramos por tonelada mtrica
o ^,0034 por i0o de oro. En muchas minas se trabaja con grados de cinco a diez partes de oro
por miiln (KocH y LINK, vol. 2, p. 385).
12.
1^
EJEMPLl7
n. t?)
0 - 100
20U
lU0 34C3
200 400
300 500
400 600
500 8t}(i
804 8t^ - 1. (X^0
1. QOa - 2.000
588
&4?
?42
42?
344
209
238
119
108
2.000 - 3.000
3.000 - 5.000
8
8
1.
^:1
caeficiente de variacin
dx = 1,01338
(7) Los datos corresponden al ejercicio nmero 20, p. 215 de G. C^LOx, y represontan los resultados de una encuesta sobre ^el consumo anual de elctricidad (en kwh} de 3.572 familias.
20
B3TADIS?1CA BSPAIYOLA
moda
ad^=150
mediana
pi^^, s = 250,28
y cuantilas
p^^^4,,^ = 138,^68
b^
p3,^.,^ = 431,9078
ESTIMACIN DE LOS PARMETROS DE LA DISTRIBL^CIN NORMAL ASOCIADA POR TRANSFORMACIN LOGARTMICA DECI^iAL ^8^
1)
sea de tres par^.metros, ser ^3 c 4, y para su estimacin puede utilizarse la expresin [7.71, resultando: ^3 =--- 39,5003. A partir de ahora se supone correcta esta
estirr^acin y se utiliza en eI resto de la seccin.
2)
-- log (z - j3^ --
2 log e
- 2,450445
pgr mediana
x = log (^u^, x - ^3^ = 2,48203845
cr = 0,3388
(e) En el resto de la seccin ts utilizarn los mismos sfmbolos para los parmetros reales y sus
estimadores.
(9) Estas expresiones se corresponden, respectivament^, con las i7.1 y t7.51, pero utilizadas aqu
en el caso de logaritmo decimal en la trarisforrnacibn.
2.
^^
LoGNORMAL
2i
De acuerdo a lo expuesto en la seccidn 3, y adrnitiendo que ^3 =-- 39,5003, deber considerarse la distribucin empfrica de intervalos de clase: log (ak_1 + 39,5003) -- log (ak -}- 39,5003}, y efectivos nk (k .- 1,11). Los estimadores de la media y varianza resultan ser, de acuerda a las expresiones t3.71 y[3.81 consideradas en el
caso de logaritmo decimal:
x= 2,44041g699
a-'-' = 0,11436995395
con lo que
r^ = 0,338186
^^
CARACTERSTICAS
DE LA DISTRIBUCIN
b= 0,13857726
ORIGINAL
3.
Cl^
SUPUESTO ^Q DESCONOCIDO
Representando en papel probabilstico los puntos (ak, F^ = ni --{- n^ -}- n3 -}- ... + r^k)
con h = 1,11 se obtiene una curva del tipo de la figura 2 y+que se representa con
trazo discontinuo en el papel probabilstico ( p. 23. Si ste hubiera sido el primer
contacto establecido con la distribucin que nos ocupa habra llevado a suponer
que era ajustable por una lognormal de tres par^,metros cuyfl tercer parmetro
sera negativo; en ese caso hubiese sido conveniente estimarlo conforme se ha
hecho . arriba.
_
22
tJ!
U.
J = 2,454t345
a[ = 1+Q$' ^r
4.
Cuartilas ...........................................
Momentos .. . ..... ... .. . ...... ... . . . . .... . .. . . . . . . ..
Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Normal asociada ...............................
Papel probabiifstico ...........................
2,46225rJ5S
2,4544452
2, 4203845
2, 44+D41fi69
2,454845
0,31312
0,3368
0, 09804413
0,11347423
0, 33^818
0, 32533
0,1143699
O,1 d58412
13.
^
Moda
Varianz^
Coeficiente
de variacin
PYJ^, x
a^^. z
a^r, x
^, :
hr^a. x
oex
}^e, x
,^d, x
^x
^ r, s
!u r. x
^r Js, ae
f ^. Y
f'^d. iI
^^
xr. L
fr. Y
^rl^, 3r
DISTR,IBUCIQN
Medie.
normal. .7r
. . . . . . . .. ..
Median^
Momen- M,
tos
cent
Cuant.
De hip^ttica nor1i381
^7
....... ..... ..
T
^^ 9
3 e, -
s e^
3 ^
T , 8 91
_ _- _ _-^- - _
^
__ _
_^
__..
__
^ ^
..._ ^
._^
._._ ._
^s
>is
sa _ _.
2 ^. _ ______
_
___
---_______-
-___^_ ______
_____ _--^
__._-
--__,.
9T
>i 6
93
!0
R -
so
TO
s0
50
40
30
20
_ ^ _ ___ ____.-_ _
_._ _
__--_. _._
_._
^ __
f0
S
4
2 0'2
- -
-- _ .
_ ^
_^ -
---_
^.
. .._
--
- _^.
.^ _..
_... _
_. _.
____ .^
.__
^, a ^
3^
.,_._
._.. _.
.._ _
^ ___ _ ._._ __
__
D, 1
s ei
e e1
2^
FSTADISTICA EsPA2+F4LA
^ 4.
BIBLIt7GRAFIA
M. ..C^^.
(1943 y ss.):
(Griffinl.