Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Validacin de hiptesis de un
proceso de Poisson no homogneo
Georgina Flesia
FaMAF
22 de mayo, 2014
Bondad de ajuste
Se tienen k muestras, k 2,
H
0
) Los datos de todas las muestras provienen de una misma
distribucin.
Test de Kruskal-Wallis.
El problema de las dos muestras
R(x
i
): rango de x
i
, i -simo elemento de la muestra 1, entre los
n +m valores.
i =1
R(x
i
).
Ejemplo:
Muestra 1: 1, 7, 5, 4. Ordenamiento: 1, 2, 3, 4, 5, 7, 9.
Muestra 2: 3, 2, 9.
R = 1 + 4 + 5 + 6 = 16
.
Test de suma de rangos
R = suma de los rangos de la primera muestra. Estadstico
distribucin de R, o
simulacin.
Muestras chicas
P
n,m
(r ): probabilidad que de dos conjuntos de datos igualmente
distribuidos, de tamaos n y m respectivamente, la suma de los
rangos de los datos del primer conjunto sea menor o igual a r .
Notacin:
P
n,m
(r ) = P
H
0
(R r )
Clculo de P
n,m
(r )
Denicin recursiva de P
n,m
(r ):
P
n,m
(r ) =
n
n +m
P
n1,m
(r n m) +
m
m+n
P
n,m1
(r ).
Condiciones iniciales:
P
1,0
(k) =
_
0 k 0
1 k > 0.
P
0,1
(k) =
_
0 k < 0
1 k 0.
Clculo recursivo del valor p
P
H
0
(R r ) = 1 P
H
0
(R r 1).
H
0
: Las dos muestras estn igualmente distribuidas.
Bajo la hiptesis H
0
, todos los ordenamientos de los n +m
valores son igualmente probables.
Notacin:
N = n +m.
x
1
, . . . , x
n
: elementos de la primera muestra.
R(x
i
): rango del elemento x
i
, i = 1 . . . n.
R = R(x
1
) + +R(x
n
) tiene una distribucin aproximadamente
normal:
R E[R]
_
Var(R)
N(0, 1).
Parmetros de la distribucin de R.
E[R(x
i
)] =
N
j =1
j
1
N
=
N + 1
2
.
E[R] =
n
i =1
E[R(x
i
)] = n
N + 1
2
.
Var(R(x
i
)) =
(N 1)(N + 1)
12
cov(R(x
i
), R(x
j
)) =
N + 1
2
Var(R) = n m
N + 1
12
Distribucin de R
Bajo la hiptesis H
0
y para n y m grandes:
W =
R n
N + 1
2
_
n m
N + 1
12
N(0, 1)
) si r n
N + 1
2
2P(Z > r
) caso contrario.
r
=
r
n (N + 1)
2
_
n m(N + 1)
12
Ejemplo
H
0
: si los n +m datos son distintos, todos los ordenamientos son
igualmente probables.
Simulacin:
Estimar:
P(R r ) =
#{i | R
i
r }
k
, P(R r ) =
#{i | R
i
r }
k
.
Caso de datos repetidos
Si las muestras tienen datos repetidos, se utiliza como rango el
promedio de los rangos de dichos valores.
Ejemplo:
Muestra 1: 2, 3, 4.
Muestra 2: 3, 5, 7.
Ordenamiento:
2, 3, 3 , 4, 5, 7
R = 1 + 2.5 + 4 = 7.5.
R
i
: rango de la i -sima muestra.
n = n
1
+ +n
m
: nmero total de datos u observaciones.
H
0
: todas las muestras estn igualmente distribuidas todos
los ordenamientos de los n datos son igualmente probables.
E[R
i
] = n
i
n + 1
2
.
Estadstico:
R =
12
n(n + 1)
m
i =1
(R
i
n
i
(n + 1)/2)
2
n
i
.
Si se observa R = y, entonces
valor p = P
H
0
(R y).
H
0
) Las llegadas diarias a un sistema ocurren de acuerdo a un
Proceso de Poisson no homogneo.
=
_
T
0
(x) dx, T: long. del da.
r
i =1
N
i
r
, S
2
=
r
i =1
(N
i
N)
2
r 1
.
Si H
0
es cierta, N y S
2
deberan ser aproximadamente iguales.
Notar que H
0
no especica la media de la distribucin (), por lo
tanto debe ser estimada.
Denotamos P
m
(A) como la probabilidad bajo H
0
, suponiendo
que la media es m:
valor p = 2 min{P
m
(T t ), P
m
(T t )} .
Repetir k veces.
Estimar
P(T t ) =
#{i | T
i
t }
k
, P(T t ) =
#{i | T
i
t }
k
.
Se han observado N
i
tiempos de llegada el da i -simo:
X
i ,1
, X
i ,2
, . . . , X
i ,N
i
, . i = 1, . . . , r .
N = N
1
+ +N
r
: nmero total de llegadas.
R
i
: rango de la i -sima muestra (da).
R =
12
N(N + 1)
r
i =1
(R
i
N
i
(N + 1)/2)
2
N
i
.
Si H
0
es cierta,
R
2
r 1
.
Valor observado de R = y:
valor p = 2 min{P
H
0
(R y), P
H
0
(R y)}
= 2 min
_
P(
2
r 1
y), P(
2
r 1
y)
_
Test chi-cuadrado
calcular T = S
2
/N.
i =1
(R
i
N
i
(N + 1)/2)
2
N
i
= 14.425.
Prueba chi-cuadrado:
P(
2
4
14.425) = 0.006
En el tiempo (y
j 1
, y
j
) ocurri una llegada en el total de r das,
por lo que se estima que en un da hay un promedio de 1/r
llegadas.
Si
(t ) es la f. de intensidad, :
E[N(y
j
) N(y
j 1
)] =
_
y
j
y
j 1
(t ) dt =
1
r
.
Se puede elegir
(t ) =
1
(y
j
y
j 1
) r
, y
j 1
< t < y
j
.
Proceso de Poisson homogneo
N = N
1
+N
2
+ +N
r
: nmero total de llegadas, valor conocido
H
0
) Los N tiempos de llegada estn uniformemente distribuidos
en un da (o intervalo (0, T).)
Proceso de Poisson homogneo
Estadstico de Kolmogorov-Smirnov:
D = max
0xT
F
e
(x)
x
T