Está en la página 1de 3

Astronomy & Astrophysics manuscript no.

ParcialFinalCortazar

May 28, 2015

c
ESO
2015

Parcial Estadstica Avanzada


I. Pontifica Universidad Javeriana Cali
Andrey Cortzar - Cdigo 0222044
Presentado a: Ph.D. Rafael Tovar
Mayo 28, 2015
ABSTRACT
Context. Un economista especialista en temas de migracin y retorno, est realizando un estudio para estimar la probabilidad de ser

un retornado emprendedor en Colombia.Toma una muestra de n individuos que residan fuera del pas y les aplica una encuesta con
la informacin de dos covariables cada una con respuesta binaria.
Aims. Plantear el modelo para estimar la probabilidad de ser un retornado emprendedor,por medio de la inferencia bayesiana.
Methods. El mtodo de mxima verosimilitud para estimar = P(X = 1|x1 , x2 )i = 1, 2, 3, 4. Para estimar las distribuciones a priori
y a posteriori , se divide la poblacin en 4 grupos determinados por las covariables,y se estima la distribucin a priori, y junto la
verosimilitud, se obtendr la distribucin a posteriori y finalmente las predictivas, encontrando los hiperparmetos con el mtodo de
Tovar (2012) en ELICITING BETA PRIOR DISTRIBUTIONS FOR BINOMIAL SAMPLING revista Brasileira de Biometra . Se
har una simulacin con datos de 1000 individuos retornados.
Results. Al plantear el modelo se observa que partiendo de un experimento Bernoulli con poca informacin respecto al parmetro
es posible generar informacin adicional dada por un experto o por resultados anteriores. Con el mtodo de Laplace se estima que
h() = Beta(1, 1) por tanto la distribucin a posteriori es Beta(yi + 1, n yi + 1).
Conclusions.
Key words. Verosimilitud, distribucin a priori, distribucin a posteriori

1. Introduccin
Los pases estn interesados en estudiar la migracin de retorno desde diferentes perspectivas, como puede ser una mirada histrica, lo que permitira estudiar polticas econmicas,
los problemas que enfrenta la poblacin que retorna en su incorporacin social y laboral son otro tema de estudio como tambin
el impacto en el desarrollo econmico.
Un tema de especial inters es la relacin entre migracin de retorno y emprendimiento porque en miras de
poltica econmica los emprendedores contribuyen al crecimiento econmico de un pas, fomentando la creacin de pequeas y medianas empresas y generando nuevos empleos.
Esto lleva a los gobiernos a adoptar medidas para incentivar
en el mercado laboral la aceptacin de los retornados,por medio
de programas de apoyo al emprendimiento y al empleo.

2. Modelo Estadstico
Sea el evento E={ser emprendedor} Definamos la variable
aleatoria X que identifica a un retornado como emprendedor, por
tanto:
(
X=

1, si E
0, otro caso

Por otro lado la poblacin de retornados ser dividida en cuatro grupos definidos por su sexo y edad, asi definimos los eventos
H={Ser hombre} y A={Ser mayor a 30 aos}, por tanto tenemos
las variables aleatorias:

1, si H
0, otro caso

1, si A
0, otro caso

X1 =

X2 =

Y los grupos quedarn como G1 = (1, 1), G2 = (1, 0), G3 =


(0, 1) y G4 = (4, 4). Luego,
(
Xi =

1, si Ei
0, otro caso

donde Ei indica ser emprendedor en Gi con i = 1, 2, 3, 4 Entonces Xi Bernoulli(i ).


Sea Yi la variable aleatoria que contabiliza el nmero de emprendedores de cada grupo, por tanto:
k
X
Yi =
xi j donde k = ni representa el nmero de individuos
j=1

en el i simo grupo, as Yi Binomial(ni , i )


Para estimar i por el mtodo de mxima verosimilitud tenemos
!
ni yi
L(i |yi ) =
(1 i )(ni yi )
yi i !
ni
ln(L(i |yi )) = ln
+ yi ln(i ) + (ni yi )ln(1 i )
yi
derivando e igualando a cero, se llega a
Article number, page 1 of ??

A&A proofs: manuscript no. ParcialFinalCortazar

Fig. 1. Adiabatic exponent 1 . 1 is plotted as a function of lg internal energy [erg g1 ] and lg density [g cm3 ].

i =

yi
ni

dejando como resultado a = 647 y b = 72, por tanto la


funcin a priori para el primer grupo es h(1 ) = Beta(647, 72)

Ahora, asumiendo que todos los valores de i tienen la misma


probabilidad de ocurrir y dado que no tenemos informacin acerca de i , hacemos uso del Principio de Laplace y tenemos que
h(i ) es una distribucin uniforme o bien h(i ) = Beta(1, 1), por
tanto la distribucin a posteriori la podemos obtener como sigue:
f (i |yi ) !h(i )L(i |yi )
ni yi
f (i |yi )
(1 i )ni yi
yi i
f (i |yi ) i11 (1 i )11 iyi (1 i )ni yi
f (i |yi ) iyi +11 (1 i )ni yi +11
entonces:
f (i |yi ) = Beta(yi + 1, ni yi + 1)
En el caso de tener informacin acerca de i , como puede
ser conocer el intervalo de credibilidad para cada i podemos
obtener los parmetros de la distribucin a priori, utilizando
el mtodo propuesto por Tovar[1] en ELICITING BETA
PRIOR DISTRIBUTIONS FOR BINOMIAL SAMPLING
revista Brasileira de Biometra. A continuacin se mostrar
el procedimiento para el primer grupo donde se asume que
i [0.85, 0.95] con una credibilidad del 95 %.
El centro del intervalo, corresponde a la media de la distribucin Beta(a,b):
0 =

0.85 + 0.95
a

2
a+b

as,
0 = E() =

a
= 0.9
a+b

Usando la desigualdad de Chebyshev, es posible tener la varianaza de , as:


1
P(| 0 | k) 2 =
k
P([ 0 ] k 2)
2

P( [ 0 ] 2)
2

Reemplazando por 1 = 0.85 tenemos una aproximacin


de la varianza de ,
ab
2 [ 0 ]2
(a + b)2 (a + b + 1)
Note que la media y la varianza de pueden escribirse como
funcin de los hiperparmetros a,b de la distribucin a priori,
por tanto para encontrar tales parmetros se soluciona el sistema

= 0.9

a+b

ab

= 0.000125

2
(a + b) (a + b + 1)
Article number, page 2 of ??

De esta manera para cada grupo se va a resolver el sistema

a
1 + 2

a+b =
2

ab

(a + b)2 (a + b + 1) = [1 0 ]
aqu i [1 , 2 ] y i0 es el punto medio del intervalo, de
esta manera se tendr la funcin a priori
#
"
[( + 1)2 2 ]
h(i ) = Beta b, 3
( + 32 + 3 + 1)2
i0
con =
(1 i0 )
vamos ahora a obtener la distribucin predictiva a priori,
Z
f (yi ) =
h(i )L(i |yi )di , con h(i ) = Beta(1, 1)

!Z 1
ni
f (yi ) =
yi +11 (1 i )ni yi +11 di
yi 0 i
! Z 1
ni
1 yi +11
i
(1 i )ni yi +11 di
f (yi ) =
k
k
yi
0
(yi + 1)(ni yi + 1)
donde k =
(yi + 1 + ni yi + 1)
!
ni yi !(ni yi )!
f (yi ) =
yi (ni + 1)!
1
f (yi ) =
ni + 1
por tanto la distribucin predictiva a priori es Uniforme
(0, ni + 1)
por tanto P(Yi 1) =

yi
X
k=1

1
ni + 1

yi
ni + 1
Para calcular la distribucin predictiva a posteriori tenemos
en cuenta:
P(Yi 1) =

f (y0i |yi )

f (i |yi )L(i |yi )di


0

(ni + 2))
tenemos
(yi + 1)(ni yi + 1)
!
Z 1
0
0
yi +11
ni yi +11 ni yi +
0
ri
(1 i )
i (1 i )ni yi di
f (yi |yi ) =
y
i
0
! Z 1
ni
yi +y0i +11
2ni yi y0i +11
0
f (yi |yi ) =
r
i
(1 i )
di
yi
0
!
(yi + y0i + 1)(2ni yi y0i + 1)
ni
(ni + 2)
f (y0i |yi ) =
(2ni + 2)
yi (yi + 1)(ni yi + 1)

con r =

Andrey Cortzar - Cdigo 0222044: Parcial Estadstica Avanzada

! !
ni ni
(ni + 1)
y0i yi
0
!
f (yi |yi ) =
2ni
(2ni + 1)
yi + y0i
entonces f (y0i |yi ) = Hipergeometrica(2ni , ni , yi + y0i )
luego P(Yi 1) = 1 P(Yi < 1)
P(Yi 1) = 1 P(Yi < 1)
!
ni
y0
P(Yi 1) = 1 i !
2ni
y0i
Por medio de simulacin, se generaron 1000 datos de indivduos retornados, y se dividieron en los 4 grupos anteriormente mencionados generando valores de las proporciones de
emprendedores por cada uno, para despus realizar un ejercicio
de estimacin de dichas proporciones.
A continuacin la tabla de resultados obtenidos a partir de la
simulacin de 1000 individuos
Grupo Emprendedores No emprendedoresTotal individuos
(1,1) 229
61
290
(1,0) 255
105
360
(0,1) 12
308
320
(0,0) 18
12
30
Usando el mtodo de mxima verosimilitud, se pueden
calcular las proporciones de emprendedores por grupo, tenemos
entonces:
229
1 =
= 0.78
290
255
2 =
= 0.71
360
12
= 0.03
3 =
320
18
4 =
= 0.6
30

2
3
4

Beta(647,72)
Beta(4739,2441)
Beta(1182,636)

3. Resultados
La tabla a continuacin contiene las diferentes estimaciones
de calculadas a partir de los distintos mtodos, por mxima
verosimilitud (mv ), con funciones apriori no informativas (nin f )
e informativas (in f ) con su respectivo intervalo de credibilidad.
Grupo (mv ) (nin f )(in f )I95
1
0.78 0.78 0.89 [0.85,0.95]
2
0.71 0.77 0.89 [0.85,0.95]
3
0.03 0.04 0.66 [0.575,0625]
4
0.6 0.58 0.65 [0.6,0.7]
Se puede notar que a pesar de no tener informacin acerca
de se puede obtener a partir del mtodo de Laplace o de mxima verosimilitud, que tienen valores cercanos, por lo que en la
inferencia bayesiana es irrelevante el mtodo de muestreo.
Con la distribucin a priori obtenida a partir del mtodo de
Laplace, calculamos P(Yi 1) y tenemos :
229
P(Y1 1) =
= 0.78
291
225
P(Y2 1) =
= 0.62
361
12
= 0.78
P(Y3 1) =
320
18
P(Y4 1) =
= 0.6
30
Con estos resultados, se estima que de cada 100 hombres
retornados mayores a 30 aos, 78 son emprendedores, de cada
100 con 30 aos o menos, 62 emprenden. En las mujeres el 4%
de las mujeres mayores a 30 aos son emprendedoras, mientras
que aquellas que tienen 30 o menos el 61% lo son.

References
Tovar, 2012, en Eliciting Beta Prior Distributions For Binomial Sampling revista
Brasileira de Biometra.

Asumiendo distribuciones a priori no informativas, por


medio del principio de Laplace obtendremos las distribuciones
a posteriori para cada caso, dado que f (i |yi ) = Beta(yi + 1, ni
yi + 1) entonces:
f (1 |y1 ) = Beta(230, 62)
f (2 |y2 ) = Beta(356, 106)
f (3 |y3 ) = Beta(13, 309)
f (4 |y4 ) = Beta(18, 13)
Ahora, con informacin dada por un experto tenemos que
las proporciones de los primeros dos grupos estn entre 0.85
y 0.95, para el tercero la proporcin es de 0.66 ms o menos
0.025 y para el ltimo la proporcin est entre 0.6 y 0.7 todos
con probabilidad del 95 por ciento. Con esta informacin y
con le mtodo propuesto por Tovar[1], podemos obtener los
hiperparmetros de las distribuciones y queda:
Grupo Funcin a priori
1
Beta(647,72)
Article number, page 3 of ??

También podría gustarte