Está en la página 1de 10

Distribuciones de Pearson

La distribucin de Pearson en una familia de distribuciones probabilsticas


continas. Fue publicada por primera vez por Karl Pearson en 1895 y
subsecuentemente extendida por l en 1901 y 1916 en una serie de artculos
de bioestadstica.
El sistema Pearson fue originalmente ideado en un esfuerzo para modelar
observaciones visiblemente asimtricas. Era bien conocido en aquel tiempo
cmo ajustar un modelo terico para acomodar los primeros dos cumulantes o
los momentos de observados datos: Cualquier distribucin de probabilidad
puede estar extendida directamente para formar una familia de escala de
posicin. Excepto en los casos patolgicos, una familia de escala de posicin
puede estar hecha para acomodar la media (primer cumulante) y la varianza
(segundo cumulante) arbitrariamente bien. Sin embargo, no era conocido cmo
construir distribuciones de probabilidad en las cuales la asimetra (tercer
cumulante estndar) y la curtosis (cuarto cumulante estndar) pudieron estar
ajustados igualmente. Esta necesidad surgi al intentar acomodar modelos
tericos conocidos a datos observados que exhibieron asimetra. Los ejemplos
de Pearson incluyen datos de supervivencia, cules son usualmente
asimtricos. En su escrito original, Pearson identific cuatro tipos de
distribuciones (numeradas del I al IV) adems de la distribucin normal (la cual
era originalmente conocida como tipo V). La clasificacin dependi en si las
distribuciones estaban definidas en un intervalo definido, en una semirrecta, o
en los reales y si estaban potencialmente asimtricas o necesariamente
simtricas. Un segundo escrito arregl dos omisiones: Redefini la distribucin
de tipo V (originalmente inclua la distribucin normal, ahora incorporaba la
distribucin gamma inversa) e introdujo la distribucin de tipo VI.
Rhind ide una forma sencilla de visualizar el espacio de parmetros del
sistema Pearson, el cual fue adoptado por Pearson. Los tipos de Pearson son
caracterizados por dos cantidades, comnmente referidas como 1 y 2. El
2

primero es el cuadrado de la asimetra:

1= 1

donde 1 es la asimetra o el

tercer momento estandarizado. El segundo es el curtosis tradicional o cuarto


momento estandarizado: 2 = 2 + 3. Tratamientos modernos definen kurtosis
2 en trminos de cumunlant en vez de momentos, por lo tanto una distribucin
normal tenemos 2 = 0 y 2 = 3. Aqu seguimos el precedente histrico y
usamos 2. EL diagrama a la derecha muestra dada una distribucin concreta
a qu tipo de Pearson pertenece (identificado por el punto (1, 2)). Muchas de
las distribuciones asimtricas y no mesocrtica que hoy nos son familiares, no
eran conocidas a principios de 1890. Lo que hoy se conoce como distribucin
beta haba sido usada por Thomas Bayes como la Probabilidad a posteriori del
parmetro de la distribucin de Bernoulli en su trabajo de 1763 sobre la
probabilidad inversa. La distribucin beta gan prominencia debido a su
pertenencia al sistema Pearson y era conocida hasta los aos 1940 como la
distribucin Pearson tipo I. 1 (La distribucin de Pearson tipo II es un caso

especial derivada del tipo I, pero ya no es tratada por separado.) La distribucin


gamma originada como resultado del trabajo de Pearson y era conocida como
la distribucin de Pearson tipo III, antes de adquirir su nombre moderno en
1930s y 1940s. .2 El artculo de Pearson escrito en 1895 introdujo la
distribucin de tipo IV, la cual contiene la distribucin t-Student como caso
especial, precediendo por varios aos a William Sealy Gosset. En su artculo
de 1901 introdujo la distribucin gamma inversa (tipo V) y la distribucin beta
prima (tipo VI).
Aplicaciones
Estos modelos son utilizados en los mercados financieros y para parmetros
estadsticos en Hidrologa, dado su habilidad para ser parame trizadas de un
modo que tiene significado intuitivo para comerciantes de mercado, tambin es
el anlisis de la informacin hidrolgica en forma de muestras, a fin de inferir
las caractersticas con que debe ser esperado en el futuro el fenmeno que se
estudia. El avance en el campo de las computadoras y el desarrollo creciente
de mtodos numricos han dado una importancia particular al uso de la
estadstica en todas las ciencias naturales, especialmente en Hidrologa.
Definicin
Una funcin de densidad de Pearson, p, est definida para ser una solucin
vlida a una ecuacin diferencial

Donde:

Segn Ord, Pearson ide la forma subyacente de la ecuacin (1), con base,
primeramente, en la frmula para la derivada del logaritmo de la funcin de
densidad de la distribucin normal (la cual da una funcin lineal) y, en segundo
lugar, de una relacin de recurrencia para los valores en la funcin de
probabilidad de la masa de la distribucin hipergeomtrica (que produce la
funcin lineal dividida por una estructura cuadrtica).
En la ecuacin (1), el parmetro a determina un punto estacionario, y por lo
tanto bajo ciertas condiciones un moda de la distribucin, ya que:

Sale directamente de la ecuacin diferencial.


Dado que nos enfrentamos a una ecuacin diferencial lineal de primer orden
con coeficientes variables, su solucin es directa:

La integral en esta solucin simplifica considerablemente cuando ciertos casos


especiales de integrando son considerados. Pearson distingue dos casos
principales, determinados por el signo del discriminante (y por tanto el nmero
de races reales) de la funcin cuadrtica.

Tipos particulares de distribucin

Caso 1, discriminante negativo. La distribucin de Pearson tipo IV


Si el discriminante de la funcin cuadrtica (2) es
tiene races reales. Luego se define:

negativo

no

Observe que es un nmero real bien definido y 0, porque


por suposicin y por tanto b2 0. Aplicando estas tres sustituciones, la funcin
cuadrtica (2) es transformada en:

La ausencia de races reales es obvio en esta formulacin ya que 2 es


necesariamente positiva.
Ahora expresamos la solucin de la ecuacin diferencial (1) en funcin de y:

Pearson (1895, p. 362) lo llam el "caso trigonomtrico", debido a la integral:

Involucra la funcin trigonomtrica inversa arcotangente. Entonces:

Finalmente sea:

Aplicando estas sustituciones, obtenemos la funcin paramtrica:

Esta funcin de densidad sin normalizar tiene soporte en toda la lnea real.
Depende del parmetro de escala > 0 y el parmetro de forma m>1/2 y v. Un
parmetro se perdi cuando preferimos encontrar la solucin a la ecuacin
diferencial (1) como una funcin de y o de x. Por lo tanto volvemos a introducir
un cuarto parmetro, llamado parmetro de posicin . As hemos derivado la
funcin densidad de la distribucin de tipo Pearson IV:

La normalizacin de las constantes involucra funcin gamma compleja () y la


funcin beta (B).
Distribucin de Pearson tipo VII
El parmetro de la forma de la distribucin de Pearson tipo IV controla su
asimetra. Si fijamos su valor a cero, obtenemos una familia simtrica de tres
parmetros. Este caso especial es conocido como Distribucin de Pearson tipo
VII (cf. Pearson 1916, p. 450). Su funcin de densidad es:

Donde B denota la funcin Beta.


Una parametrizacin alternativa (y una ligera especializacin) de la distribucin
tipo VII es obtenida permitiendo

Lo cual requiere m>3/2. Esto conlleva una prdida menor de generalidad pero
asegura que la varianza de la distribucin existe y es igual a 2. Ahora el
parmetro m solo controla la curtosis de la distribucin. Si m tiende a infinito
como y se mantiene constante, la distribucin normal emerge como un caso
especial:

Esta es la funcin de densidad de la distribucin normal con media y


desviacin estndar .
Es conveniente exigir que m > 5/2 y dejar que:

Esta es otra especializacin, y garantiza que los primeros cuatro momentos de


la distribucin existan. Ms aun, la distribucin de Pearson tipo VII
parametrizada en trminos de (, , 2) tiene como media , como desviacin
estndar , asimetra cero y curtosis exceso es 2).
Distribucin t-Student
La distribucin de Pearson tipo VII es equivalente a la distribucin t-Student no
estandarizada con parmetros > 0, , 2 aplicando las siguientes
sustituciones a su parametrizacin original.

Observe que la restriccin m > se satisface.


La funcin de densidad resultante es:

La cual es ms conocida como la densidad de distribucin t-student.


Note adems que esto implica que la Distribucin de Pearson tipo VII subsume
la distribucin t-Student estndar y tambin la distribucin de Cauchy estndar.
En particular, la distribucin t-Student estndar emerge como un subcaso
cuando = 0 y 2 = 1, equivalente a las siguientes sustituciones.

La densidad de est restringida familia de un solo parmetro es una t-student


estndar:

Caso 2, discriminante no negativo


Si la funcin cuadrtica (2) tiene discriminante no
tiene como races reales a1 y a2 (no necesariamente distintas):

negativo

En presencia de races reales, la funcin cuadrtica (2) puede ser escrita como

y por lo tanto la solucin de la ecuacin diferencial es:

Pearson (1895, p. 362) la llam el "caso logartmico", debido a la integral

Involucra solo la funcin logartmica, y no la funcin arcotangente como en el


caso anterior.

Usando la sustitucin

Obtenemos la siguiente solucin a la ecuacin diferencial (1):

Dado que esta densidad es slo sabida hasta una constante escondida de
proporcionalidad, esa constante puede variarse y la densidad puede escrita
como sigue:

Distribucin de Pearson tipo I


La Distribucin de Pearson tipo I (una generalizacin de la distribucin beta
surge cuando las races de la ecuacin cuadrtica (2) son de signos opuestos,
eso es
Luego la solucin p es soportada en intervalo
Aplicando la sustitucin

La cul produce una solucin en trminos de y que est soportada en el


intervalo (0, 1):

Uno puede definir:

Reagrupando las constantes y parmetros, esto se simplifica a:

Resulta que m1, m2 > 1 es necesario y suficiente para que p sea una funcin
de densidad de probabilidades.
Distribucin de Pearson tipo II
La distribucin de Pearson de tipo II es un caso especial de la familia de
Pearson de tipo I restringida a distribuciones simtricas.
Para la curva de Pearson de tipo II:

Donde

La ordenada, y, es la frecuencia de

d 2 . La curva de Pearson de tipo II es

usada en computar la tabla de coeficientes de correlacin significativos para el


coeficiente de correlacin de Spearman cuando el nmero de elementos en
una serie es menor a 100(o 30 dependiendo en algunas fuentes). Luego, la
distribucin imita una distribucin t- student estndar. Para la tabla de valores,
ciertos valores son usados como constantes en la ecuacin previa:

Los momentos de x usada son:

Distribucin de Pearson tipo III

La distribucin de Pearson tipo III es una distribucin gamma o una distribucin


chi-cuadrado.
Distribucin de Pearson tipo V

Definiendo nuevos parmetros:

La distribucin de Pearson tipo V es una distribucin gamma inversa.


Distribucin de Pearson tipo VI

La distribucin de Pearson tipo VI es una distribucin beta prima o


una Distribucin F.

Ejemplo
Se tiene una estacin con 30 aos de registros de caudales mximos
instantneos con Media de 4144 pie3/s y desviacin estndar de 3311 pie3/s. Si
el coeficiente de asimetra de los caudales es de 1.981 pie 3/s cual es caudal
para un periodo de retorno de 100 aos y su intervalo de confianza.
QTr100 = X+ SK
K es F de tablas se obtiene K=3.595

(1.9, 100) = 3.553


(2.0, 100) = 3.605

QTr100 = 4144+ (3.595) (3311)


QTr100 = 16050 pie3/s
Intervalos de confianza
Xt t(1-a).Se
d = F de tablas se obtiene d =8.4922

(1.9, 100) = 8.2196


(2.0, 100) = 8.5562

Se = 5133.56 pie3/s
t(1-a) = t(0.95) = 1.645 (Ledo de la tabla de la normal)
16050 (5133.56) (1.645)

[7605.29 pie3/s - 24494.71pie3/s] Intervalos de confianza para QTr100

También podría gustarte