Está en la página 1de 5

EPG3322 - Tarea 1

Felipe Arancibia
23-09-2021

Pregunta 1
Letra a)
Calculamos el Estimador KM manualmente, a través de la siguiente tabla:

tk dk qR nk ŝ(t)
0 0 0 8 1
1 1 0 8 1 × 1 − 18 = 0, 875 (1)
2 1 1 7 0, 875 × 1 − 71 = 0, 75
3 2 3 5 0, 75 × 1 − 25 = 0, 45
Luego, graficámos la funcion de sobrevivencia:

1.0

0.8
s_t

0.6

0 1 2 3
t_k

1
Letra b)

Estimador Kaplan−Meier S(t)


^

1.0

0.8

Survival 0.6

0.4

0.2

0.0

0 1 2 3 4 5 6

Pregunta 2
Letra a)
Expresion para t*
ht_diff=function(t,lambda=1,p=1){
(lambda*p*t^(p-1))/(1+lambda*t^p)
}

Letra b)
Para lambda=3 y p=2, obtenemos un t*=0.5773553.
optimize(ht_diff,c(-10,10),lambda=3,p=2,maximum = TRUE)

## $maximum
## [1] 0.5773553
##
## $objective
## [1] 1.732051

Luego para lambda=3 y p=0.7, no encontramos máximo.


optimize(ht_diff,c(-10,10),lambda=3,p=0.7,maximum = TRUE)

2
Pregunta 3
Letra e: EMV

EMV=sum(datos$censura)/sum(log(1+datos$tiempos))
EMV

## [1] 4.435275

Letra f: S(t) y K-M


Estimador K-M:

Estimador Kaplan−Meier S(t)


^

1.0

0.8
Survival

0.6

0.4

0.2

0.0

0.0 0.2 0.4 0.6 0.8 1.0

Letra g: S(90/365)
La probabilidad de sobrevivencia es de: 0.3762374
S_X(90/365)

## [1] 0.3762374

Pregunta 4
Letra a)
yi = min(ti , ci )
donde :
ti : tiempodeentrega
ci : tiempolimite

¿A qué corresponde yi si la observación es censurada?

R: ci , el tiempo de duración del estudio, es decir, el tiempo limite

¿Y si no es censurada?

3
R: ti , el tiempo de sobrevivencia observado, es decir, el tiempo de entrega

Letra b)
Pedidos no entregados a tiempo: 34.937
pedidosNoEntregados

## [1] 34937

Que equivale al 32,8 % de las observaciones


pedidosNoEntregados/nrow(Datas)

## [1] 0.3276255

Tiempo máximo que tarde un pedido: 0.78 horas.


t_max=max(Datas$t[Datas$censored==1])
t_max

## [1] 0.7804024

Total pagado
datos_observados=Datas[Datas$censored==1,]
summary(datos_observados$totalpaid)

## Min. 1st Qu. Median Mean 3rd Qu. Max.


## 0.00 8.20 11.70 15.36 18.50 524.20

Numero de productos
summary(datos_observados$n_item)

## Min. 1st Qu. Median Mean 3rd Qu. Max.


## 1.000 1.000 2.000 2.403 3.000 41.000

Letra c)

Estimador Kaplan−Meier S(t)


^

1.0

0.8
Survival

0.6

0.4

0.2

0.0

0.0 0.2 0.4 0.6 0.8

Vemos que la forma suave de la curva, se explica por la cantidad de observaciones. Por otro lado, el
quiebre en la función del estimador KM, cerca del tiempo 0.33, se corresponde con los mı́nimos tiempos
registrados en las observaciones, por lo que antes de eso la función se mantiene constante. Luego de eso la
función, cae lentamente hasta el maximo tiempo registrado, que es: 0.78

4
Letra d)
Rregresión:

Del resumen del modelo vemos que los predictores no son estadisticamente significativos, por lo que ni el
numero de productos, como el total pagado, tendrı́an relación con los tiempos de entrega.

totalpaid: p-value: 0.45


n item: p-value: 0.50
summary(fit)

##
## Call:
## survreg(formula = Surv(t, censored) ~ totalpaid + n_item, data = Datas,
## dist = "weibull")
## Value Std. Error z p
## (Intercept) -4.91e-01 1.70e-03 -288.01 <2e-16
## totalpaid 7.18e-05 9.51e-05 0.76 0.45
## n_item 4.82e-04 7.22e-04 0.67 0.50
## Log(scale) -1.37e+00 2.97e-03 -461.84 <2e-16
##
## Scale= 0.254
##
## Weibull distribution
## Loglik(model)= 6297.3 Loglik(intercept only)= 6296
## Chisq= 2.69 on 2 degrees of freedom, p= 0.26
## Number of Newton-Raphson Iterations: 5
## n= 106637

Ploteo Funcion de Sobrevivencia y Estimador KM

1.0
Regresion
0.8 KM

0.6
S(y)

0.4

0.2

0.0

0.0 0.2 0.4 0.6 0.8 1.0

También podría gustarte