Está en la página 1de 8

Universidad del Bio Bio Facultad de Ciencias Magister Mención Estadística Informática I Programación del comando cuantile (Quantile)

Alumno: Iván Aliaga Casceres. Prof.: Sergio Contreras

Abril de 2015

Resumen

Se presenta la programación del comando «quantile» en el programa R, para tal fin se realiza un análisis del paper «Samples Quantiles in Statistical Packages» del autor Rob J. Hyndman y Yanan Fan.

1. Introducción

Primeramente la distribución de los cuantiles se definen como:

Q(p) = F 1 (p) = in f {x : F(x) p} , 0 < p < 1

Donde F(x) es la función de distribución. Los cuantiles proporcionan un estimador no paramétrico para las

partes de una población basada en una muestra de observaciones independientes {X 1 ,

o el

método de estimación i esimo´ estimado

Una dificultad en la comparación de la definición de cuantil es que hay un número notable de maneras en el cálculo equivalentes en la definición entre ellos. Sin embargo, los cuantiles que se utilizan en los paquetes estadísticos se basan en el cálculo de uno o dos estadísticos de orden, y se pueden escribir como.

F.

, X n }de la distribución

Sea X (1) ,

, X (n) los estadísticos de orden de {X 1 ,

.,9.

ˆ

, X n } y sea Q i (p) la definición de cuantil i esima´

Q ˆ i (p) = (1 γ) X (j) + γ X (j+1)

Donde

j m

n

p < j m + 1

n

(1)

El valor de γ esta en función de j= pn + m 1 y g=pn + m j. Se observa los siguientes 9 metodos algorítmicos que se basan a partir de 1.

2. Algoritmos

2.1. Definición 1

Esta primera definición es la inversa de la distribución empirica que se obtiene haciendo m=0.

γ =

1

0

g > 0 g = 0

1 u denota el valor entero más grande no mayor al valor u; x denota el valor entero mas pequeño no menor al valor x.

1

Para esta definición 2

y

2.2. Definición 2

ˆ

Freq X k Q 1 (p) = pn

ˆ

Freq X k Q 1 (1 p) = pn + 1

La definición 2 es similar a la definición 1 excepto que se usa un promedio cuando g=0 dado que m = 0.

y

γ =

g = 0

1 g > 0

2

1

ˆ

Freq X k Q 2 (p) = Freq(X k

Q ˆ 2 (1 p)) = pn

2.3. Definición 3

ˆ

En esta definición Q 3 (p) se define como estadistico de orden X (k) donde k es el valor entero más cercanoa np.

1

Asi tenemos que m= 2 y cuando g > 0, asi.

bajo esta definición:

γ = 0

1

g=0 y j es par E.O.C.

y

Freq(X k

Q 3 (p))= pn

ˆ

pn +

1

2

Freq(X k Q 3 (1 p))=

ˆ

pn

pn

+

+ 1

1

2

g = 0, y pn par E.O.C.

g = 0 y (1 p)n par E.O.C.

2.4. Definición 4

Parzen (1979) sugiere el cálculo por interpolación en el paso de la definición 1, esto equivale a realizar p k = k

n .

2.5. Deinición 5

Una definición muy antigua definido por Hazen, esta basado en p k =(k 1/2)/n., este es un valor que tiene se define en la primera definicíon . Ahora se L una medida de estimación de localidad 3 hay dos clases definiciones de cuantiles, la primera aplica p k =LF(X (k) ) y la seguna a p k = F(L(X (k) )), si F tiene distribución uniforme, dos aplicaciones son equivalentes, si L denota la mediana y F es estrictamente monotona las dos aplicaciones son equivalentes porque la mediana es invariante ante transformaciones monotonas. Siguiendo la primera aplicación, cuando F(X k ) tiene la forma de distribución de F(X (k) ) de una distribucion estadístico k-ordenado de una distribucion uniforme, llamado distribución beta β(k, n k + 1), dado que esta distribución es libre el resultado no depende de la distribución F , de esta forma se tiene que:

Q(p k )=Q(F(LX (k) )) = LX (k) =

Q ˆ i (p k )

2 Freq (X k x)Denota el número de observaciones menores o iguales a x. 3 Media, mediana o la moda.

2

2.6.

Definicion 6

k

Weibull (1939) y Gumbel (1939) proponen p k = n+1 . En este caso p k =E F(X (k) ) y los vertices se dividen en una muestra del espacio en n + 1 regiones cada uno con probabilidad 1/(n + 1), en particular.

Pr(X < X (1) ) = Pr(X > X (n) ) = 1/(n + 1)

2.7. Definición 7

Gumbel (1939) tambien considera la posición modal p k =moda(F(X (k) )) = (k 1)/(n 1) una propiedad in-

ˆ

teresante es que los vertices de Q 7 (p) divide el rango en n 1 intervalos y exctamente 100p % de los intervalos

que estan a la izquierda de Q 7 (p) y 100(1 p) % que estan a la derecha de Q 7 (p).

ˆ

ˆ

2.8. Definicion 8

La posición de la mediana es dificil de obtener por lo que se obtiene aproximando con la formula:

2.9. Definición 9

p k =(k 1/3)/(n + 1/3)

Blom (1958) muestra que p k = (k 3/8)/(n + 1/4) para la arproximación a F(EX k ) para la distribución nor-

mal. Sin embargo Q 9 (p k ) es insesgado y estima a Q(p k ) cuando F tiene una distribución normal puesto que esta

definición es usada para obtener el QQ-plot de una muestra general de la definición de cuantil.

ˆ

3. Implementación en R

Los algoritmos anteriormente citados se implementan en R y su codigo fuente es la siguiente:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

Realizando pruebas
Realizando pruebas

6