Está en la página 1de 12

Estadística No Paramétrica

Sesión 3
FACU LTAD DE I NGEN I ERÍ A ECO N ÓM ICA , ESTA D Í ST I CA Y
CI ENCI AS S O CI AL ES
Ing. Solange Basualdo
Email: lbasualdo@uni.edu.pe
Tw i t t e r : @ s o l a n g e _ 0 2 1 1
Distribución de la mediana y el rango
Distribución de la mediana
(𝑛+1)
Para n impar, la mediana de una muestra tiene la fdp con 𝑟 = . Si n es par y se desea un valor
2𝑋 +𝑋
𝑛 𝑛+2
2 2
único para la mediana U de la muestra, la definición usual es U =
2

Para n=2m. Tenemos que x<y


(2𝑚)!
𝑓𝑋(𝑚),𝑋(𝑚+1) 𝑥, 𝑦 = 2
[𝐹𝑋 𝑥 ]𝑚−1 ∗ 1 − 𝐹𝑋 𝑦 𝑚−1
𝑓𝑋 𝑥 𝑓𝑋 𝑦
[ 𝒎 − 𝟏 !]
𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑥 < 𝑦
𝑚−1
(2𝑚)! 2
[2𝑢 − 1]𝑚−𝑘−1 [ 1 − 𝑢 𝑘+𝑚
− 1 − 2𝑢 𝑘+𝑚
] 𝑠𝑖 0 < 𝑢 ≤ 1/2
𝒌! 𝒎 − 𝟏 ! 𝒎 − 𝒌 − 𝟏 ! (𝒌 + 𝒎)
𝑘=0
𝑓𝑈 𝑢 = 𝑚−1
(2𝑚)! 2
[2𝑢 − 1]𝑚−𝑘−1 1 − 𝑢 𝑘+𝑚
𝑠𝑖 1/2 < 𝑢 ≤ 1
𝒌! 𝒎 − 𝟏 ! 𝒎 − 𝒌 − 𝟏 ! (𝒌 + 𝒎)
𝑘=0
Distribución de la mediana y el rango
Ejemplo
Se extrae una muestra aleatoria de tamaño n de la distribución de funciones de potencia estándar
con densidad
𝑓 𝑥 = 𝑣𝑥 𝑣−1 0 < 𝑥 < 1 𝑣 > 0
Obtenga la distribución del r-ésimo estadístico de orden y la distribución conjunta del r-+ésimo y s-
ésimo estadístico de orden
Distribución de la mediana y el rango
Distribución del rango
𝑅 = 𝑋(𝑛) − 𝑋(1)
La distribución conjunta de 𝑋(1) 𝑦 𝑋(𝑛) es:
𝑛−2
𝑓𝑋(1) ,𝑋(𝑛) 𝑥, 𝑦 = 𝑛 𝑛 − 1 𝐹𝑋 𝑦 − 𝐹𝑋 𝑥 𝑓𝑋 𝑥 𝑓𝑋 𝑦 𝑥<𝑦

Luego

𝑓𝑅 𝑢 = −∞
𝑛 𝑛 − 1 𝐹𝑋 𝑣 − 𝐹𝑋 𝑣 − 𝑢 𝑛−2 𝑓𝑋 𝑣 − 𝑢 𝑓𝑋 𝑣 para u>0
𝑓𝑅 𝑢 = 𝑛 𝑛 − 1 𝑢𝑛−2 1 − 𝑢 0<𝑢<1
Distribución beta(n-1,2)
Ejemplo: Obtenga la función de densidad del rango en una muestra aleatoria de
tamaño n=3, distribución exponencial con densidad 𝑓 𝑥 = 𝑒−𝑥 ; 𝑥 > 0
Momentos exactos del estadístico de
orden
K-ésimo momento con respecto al origen

𝑛!
𝐸(𝑋 𝑘𝑟 ) = 𝑦 𝑘 𝐹𝑋 𝑦 𝑟−1 1 − 𝐹𝑋 𝑦 𝑛−𝑟 𝑓𝑋 𝑦 𝑑𝑦
𝑟 − 1 ! 𝑛 − 𝑟 ! −∞

𝑛!
𝐸(𝑋 𝑘𝑟 ) = 𝑦 𝑘 𝐹𝑋 𝑦 𝑟−1 1 − 𝐹𝑋 𝑦 𝑛−𝑟 𝑑𝐹𝑋 𝑦
𝑟 − 1 ! 𝑛 − 𝑟 ! −∞
1
𝑘 𝑛!
𝐸(𝑋 𝑟 ) = 𝑄𝑋 𝑢 𝑘 𝑢 𝑟−1 1 − 𝑢 𝑛−𝑟 𝑑𝑢
𝑟−1 ! 𝑛−𝑟 ! 0
𝐸(𝑋 𝑘𝑟 ) = 𝐸[𝑄𝑋 𝑈 ]𝑘
Donde, 𝑈~𝐵𝑒𝑡𝑎(𝑟, 𝑛 − 𝑟 + 1)
Ejemplo: Halle el p-ésimo momento del estadístico de r de la distribución exponencial.
Momentos exactos del estadístico de
orden
Caso particular: El estadístico de orden r de una muestra aleatoria de tamaño
n con distribución uniforme (0,1)
Para algún 1<=r<=n y k. En particular, la media es
𝑟
𝐸(𝑋(𝑟) ) =
𝑛+1
Y la varianza
𝑟(𝑛 − 𝑟 + 1)
𝑉(𝑋(𝑟) ) =
(𝑛 + 1)2 (𝑛 + 2)
Donde, 𝑋(𝑟)~𝐵𝑒𝑡𝑎(𝑟, 𝑛 − 𝑟 + 1).
Covarianza entre X(r) y X(s)
∞ 𝑦
𝑛!
𝐸(𝑋(𝑟)𝑋(𝑠)) = 𝑥 𝑥𝑦 𝐹𝑋 𝑥 𝑟−1 𝐹𝑋 𝑦 − 𝐹𝑋 𝑥 𝑠−𝑟−1 1 − 𝐹𝑋 𝑦 𝑛−𝑠 𝑓𝑋 𝑥 𝑓𝑋 𝑦 𝑑𝑥𝑑𝑦
𝑟 − 1 ! 𝑠 − 𝑟 − 1 ! 𝑛 − 𝑠 ! −∞ −∞
1 𝑄𝑋 𝑣
𝑛!
𝐸(𝑋(𝑟)𝑋(𝑠)) = 𝑥 𝑄𝑋 𝑢 𝑄𝑋 𝑣 𝑢 𝑟−1 𝑣 − 𝑢 𝑠−𝑟−1 1 − 𝑣 𝑛−𝑠 𝑑𝑢𝑑𝑣
𝑟−1 ! 𝑠−𝑟−1 ! 𝑛−𝑠 ! 0 0

Caso particular. U(0,1)


𝑟 𝑠+1
𝐸 𝑋𝑟𝑋𝑠 =
𝑛+1 𝑛+2
𝑟 𝑛−𝑠+1
Luego Cov 𝑋 𝑟 𝑋 𝑠 = 𝑝𝑎𝑟𝑎 𝑟 < 𝑠
𝑛+1 2 𝑛+2

𝑛𝑟−𝑠+1 1
Entonces, Co𝑟𝑟 𝑋 𝑟 𝑋 𝑠 = [𝑠(𝑛−𝑟+1)]2
1
Caso particular. Co𝑟𝑟 𝑋 1 𝑋 𝑛 =𝑛
Intervalo de confianza para la
mediana
Supongamos que Y1 <Y2 <Y3 <Y4 <Y5 son las estadísticas de orden de una
muestra aleatoria de tamaño n = 5 de una distribución continua. Vemos que Y3
sirve como un buen estimador puntual de la mediana m.
Supongamos que sugerimos que el intervalo restringido por las estadísticas de
primer y quinto orden, es decir, (Y1, Y5), serviría como un buen intervalo. ¿Qué
tan seguros podemos estar de que el intervalo (Y1, Y5) contenga la mediana
desconocida poblacional m? Para responder a esa pregunta, simplemente
necesitamos calcular la siguiente probabilidad:
𝑃 𝑌1 < 𝑚 < 𝑌5
El cálculo de la probabilidad se reduce a un simple cálculo binomial una vez que
descubrimos todas las formas en que la mediana de la población m está intercalada
entre Y1 e Y5. Bueno, la mediana poblacional m está intercalada entre Y1 e Y5, si la
estadística de primer orden es la única estadística de orden menor que la mediana m:
Intervalo de confianza para la
mediana
1ra forma
Y1 m Y2 Y3 Y4 Y5

2da forma
Y1 Y2 m Y3 Y4 Y5

3ra forma
Y1 Y2 Y3 m Y4 Y5
4ta forma
Y1 Y2 Y3 Y4 m Y5
Intervalo de confianza para la
mediana
Esto significa que para calcular la probabilidad P (Y1 <m <Y5),
necesitamos calcular la probabilidad de cada uno de los eventos
anteriores. Ahora, si denotamos como W los números Xi < m, entonces
W es una variable aleatoria binomial con n ensayos mutuamente
independientes y probabilidad de éxito p = P (Xi < m) = 0.5.
P(Y1 < m < Y5) = P(W = 1) + P(W = 2) + P(W = 3) + P(W = 4)
4 4 5
𝑃 𝑌1 < 𝑚 < 𝑌5 = 𝑖=1 𝑃 𝑊=𝑘 = 𝑖=1 𝑘 0.5 𝑘 (0.5)5−𝑘 = 0.9376

Ejercicio. Calcule el I.C. de la mediana cuando se encuentra entre los


estadísticos de orden 2 y 4.
Aproximaciones normales de los
coeficientes de confianza
Todos nuestros cálculos de coeficientes de confianza han involucrado
probabilidades binomiales. Es lógico, entonces, que si nuestro tamaño
de muestra n es mayor que 20, digamos que podríamos usar la
aproximación normal a la distribución binomial. En nuestro caso, W, el
número de Xi <m, sigue una distribución binomial con media y varianza:
μ = 𝑛𝑝 = 0.5𝑛
𝜎 2 = 𝑛𝑝 1 − 𝑝 = 0.5 1 − 0.5 n = 0.25n
Luego.
𝑊−0.5𝑛
𝑍=
0.25𝑛
Ejemplo
Una muestra de 26 trabajadores petroleros participó en un ejercicio de escape simulado,
lo que dio como resultado los siguientes datos de tiempo (en segundos) para completar el
escape:
325 325 334 339 356 356 359 359 363
364 364 366 369 370 373 373 374 375
389 392 393 394 397 402 403 424
Use la aproximación normal a la binomial para encontrar el intervalo de confianza
asociado a los estadísticos de orden (Y8, Y18) para la mediana m.

También podría gustarte