Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cortes Transversales
Módulo 3
M. Misas A.
1
Variables Dependientes Limitadas
Distribución Truncada
•Una distribución truncada es una parte de una distribución no truncada. Se refiere a
una parte seleccionada por encima o por debajo de algún valor particular.
•El truncamiento es esencialmente una característica de la distribución de donde la
muestra ha sido extraída.
3
Algunas ideas acerca de la función de densidad de probabilidad
Puntos de masa
PX x j si X x j Dominio :
f X x
0 si X x j Recorrido : 0,1
f X x dx 1
Dominio :
x
Recorrido : 0, FX x f X u du
4
Se considera relevante solo la parte de
la distribución por ecima del punto de
truncamiento. Se reescala bajo el
supuesto de que una observación no
truncada cae en el rango de interés
Distribución Normal truncada
Puntos de truncamiento
Distribución Normal
f X
X Variable aleatoria continua f X X a :
prob X a
f X x f x Función de densidad de probabilidad
5
Ejemplo
f X x f X x; a, b
1
I a , b x X ~ U 0,1
ba
f X x 1 0 x 1
EX
ab 1 f X x 1 3
f X x x
2 3 1 2 2
prob x
VAR X
b a
2
3
3
12
1
x 1
3
1
f t 2 2
1
2 2
exp 2 t
2
t
z
1
z 2
1
2 exp z 2 Función de densidad de la Distribución Normal
2 6
estándar
Distribución Normal Truncada
X ~ N , 2
a
prob X a 1
1 a
siendo
Función de distribución acumulada de la
f x normal estándar
f X x x a X
1
2 e x / 2
2 1 / 2 2 2
Densidad de la distribución
1 normal truncada
1/ x /
1 7
Distribución de Poisson Truncada
e
y
probY y y 0
y!
probY 0
e
y
y!
1 probY 0
e
y
y!
0, y 1,2,
1 e
8
Valor esperado y varianza de una distribución truncada
E X X a Xf X dX
a
Ejemplo:
12
X 32
1
E X X 1 dX La distribución no truncada:
3 1
3
1
3X2 1 2 Media
2
2 2 13 3 1
Varianza
12
2
1 1 1 1
var X X 3
3 12 27
9
Momentos de una distribución normal truncada:
X ~ N , 2
a constante Razón inversa de Mills
E X Truncamiento
a
VAR X Truncamiento 2 1
Si el truncamiento es: X a
Función Hazard 1
Si el truncamiento es: X a
Donde 0 1
10
Algunos resultados:
•Si el truncamiento es inferior, la media de la variable truncada es mayor que la
media de la variable original.
•Si el truncamiento es superior, la media de la variable truncada es menor que la
media de la variable original.
•El truncamiento reduce la varianza comparada con la varianza de la distribución
original.
Ejemplo:
El americano de ingreso alto recibe en promedio $142.000 dólares al año. El grupo
encuestado tienen como mínimo un ingreso anual de $100.000 dólares al año.
Puede este grupo encuestado decir algo acerca del americano promedio?
La impresión general es No
12
X : Ingreso
Y : ln X
ln 100 4.605
ln(142) 4.956
13
La estadística establece: EY Y 4.605
1
donde 4.605
0.98
1 0.98 2.054
2.054 0.0484
4.956 0.0484
0.02
4.956 2.420 *
14
2.635
0.959
Si
Y ~ N , y2 X e E X E e e
Y
Y 2 / 2
EX $22,087
15
Modelo de Regresión Truncada
i 1,, N yi X i' i
Eyi X i i ~ N 0, 2
•En este caso, se habla de una muestra truncada si sabemos de antemano que las
observaciones y i provienen de una parte restringida de la distribución poblacional
subyacente
16
Ejemplo:
Ninguna observación para y i puede estar por debajo del precio correspondiente
al auto nuevo más barato.
•Algunos individuos pueden desear comprar un carro nuevo pero encontrar que éste es
muy costoso, en cuyo caso no lo comprarán y no harán parte de los datos observados.
El efecto de este truncamiento deberá ser tenido en cuenta, por ejemplo, si se desea
predecir las ventas potenciales de un nuevo tipo de carro muy económico, debido a que
los compradores potenciales no hacen parte de la muestra observada.
17
En general, se puede suponer que el punto de truncamiento es igual a 0, el cual
puede siempre alcanzarse midiendo a y i como desviación del punto a .
i 1,, N
yi X i' i
i ~ N 0, 2
yi X i ~ N X i' , 2 Que sucede si se está interesado en la distribución de y i
dado que y i es mayor que un punto de truncamiento: a ?
E yi yi a; X i X i' i i i
i
X i'
1
i
a X i'
X i' Función no lineal en X , , a,
1 '
a X i
18
Matriz de diseño de información
Estimación
Como lo presenta W. Greene (1993), la primera inclinación es utilizar MCO para llevar
a cabo la estimación de
yi yi a E yi yi a; X i ei
X i' i ei ei yi yi a Eyi yi a
Var ei 2 1 i
2 1 2i i i
Proceso heteroscedástico en el término de
perturbación: i f Xi
2
1 y i xi'
1 y i xi' T a xi'
T
L Ti1 ln L ln ln 1
a xi' i 1 i 1
1
T a Xi'
ln2 ln 2 1 2 yi X
T T
ln1
2
ln L '
2
i
2 i 1 i 1
20
Condiciones de primer orden:
ln L T y i Xi' i
X Igualada
i 1 2 i 0
Resolución a través de un
Método de Optimización no
lineal
ln L T i i
yi X i'
1 T
2 Igualada
2 2 2 2 4 i 1 2 2 0
21
Efectos Marginales
1 1 2
a X Nota: i exp i
E yi yi a; X i X i' i
'
donde i i 2 2
i i
E yi yi a; X i
X i i X i
1. 2.
i i
i i
1 i i X i
i
i 1 i
i i 1 i i i
1 i 2
i 2 i i
1 i 1 i
2
2i i i 22
Así:
X
E yi yi a i2 i i
i i i
i i i
i
1 i
1 i
i i
Es de gran importancia
ln f * y y ln ln y!
expx'
Supóngase que el número de visitas a una clínica es modelado, la información solo está
disponible para aquellas personas que han visitado la clínica.
y y * si y * 0
Totalmente observado
No siempre es observado,
algunos de los individuos pueden
concentrase en el valor de cero
u otro valor específico
Una variable dependiente es censurada si todos los valores de cierto rango son
transformados a un valor simple.
•Gastos del hogar en bienes durables
•Número de relaciones extramatrimoniales
•Número de arrestos después de salir de prisión
•Gastos en vacaciones
Cada uno de estos estudios analiza una variable dependiente que toma un valor
particular (cero) para una fracción significativa de observaciones.
25
Ejemplo:
Una interpretación postula que el valor cero corresponde a una observación censurada.
Supóngase que los hogares tienen una demanda latente por bienes y
*
la
cual no se expresa como compra hasta que un umbral conocido L es superado
26
Ejemplo:
Función de utilidad
27
Ejemplo:
Supóngase que se desea estudiar el monto de donación que un individuo
Desea aportar a obras de caridad. Para una gran cantidad de individuos
Dicho valor es cero, es decir, no aportan a obras de caridad. Para otros
observamos sus donaciones Datos Censurados
28
y*
Recta de regresión entre ingresos
y donaciones
Ingreso
29
y*
Ingreso
y*
Ingreso
30
Distribución Normal Censurada
y 0 si y * 0
y y * si y * 0
Si y * ~ N , 2
Si
y * 0 la distribución que aplica es: proby 0 prob y * 0 1
Si y 0 y ~ N ,
* 2
conserva la densidad de y
*
31
Mezcla de distribuciones
Si
y* ~ N , 2 E y a 1
y a si y * a
VAR y 2 1 1
2
a
y y * si y * a
prob y a
*
1
2
Demostración:
1. E y prob y a x E y y a prob y a x E y y a
prob y* a x a prob y* a x E y * y * a
Φa 1
Φ a 1
33
2. Var y Evarianza condiciona l Var media condiciona l
Haciendo a
Var media condiciona l 1 1 2 2
2 2
1 2
2
Así, Var y 2 1 1
2
E y a 0
Si a0
34
Ejemplo
Supóngase que el estadio tiene 20000 sillas y que en la última temporada se vendió el
abono total un 25% de las veces. Si el promedio de participación, incluyendo el lleno total
fue de 18000 sillas. ¿Cuál es la media y la desviación estándar de la demanda de sillas?.
a 20000
18000 es un estimado de: Eventas 200001
20000
Si 25% es vendido total 0.75
1 0.75 0.675
0.675
0.424
0.675
1. y i X i i
* '
Eyi* Xi Xi'
Sin embargo, si los datos están siempre censurados este resultado no es muy útil
36
2. Siguiendo los momentos de una distribución normal censurada , para una
observación muestreada aleatoriamente de una población, la cual puede o no ser
censurada se tiene:
X i' '
Eyi X i X i i
X i'
i '
X
i
Ey i y i 0 X i' i
i
X i'
1
i
X i'
X i'
1 X '
i
37
Estimación
Si la distribución condicional de y* dado un conjunto de regresores X es especificada,
entonces los parámetros de la distribución pueden ser consistente y eficientemente
estimados a través de ML basados en la distribución condicional censurada de la variable y
f yi X Función de densidad
y*
F a X Función de distribución acumulada
y g y*
La estimación de este modelo es similar al modelo de regresión truncada.
1. Función de verosimilitud:
f yi X si yi a y y* si y* a
f yi X
F a X si yi a
y a si y* a
1 si y a
f yi X f yi X F a X
1d
d
d
0 si y a
38
Para T observaciones independientes, la máxima verosimilitud censurada maximiza:
ln L di ln f yi X i , 1 di ln F a X i ,
T
parámetros de la distribución
i 1
y
Dado el siguiente modelo Tobit y a : 0
f y i ~ NXi' , 2
F 0 Prob yi 0
ProbX i
'
i 0
X i'
X i'
1- 39
Densidad censurada bajo normalidad:
d 1 d
1 1 X i'
f yi X i exp 2 yi X i 1
'
2
2
2
X i'
ln L , di ln 2 ln 2 yi X i 1 di ln 1
T
1 1 1 2
2 2 '
2
2
i 1 2
ln L T 1 i
'
2 d i yi X i 1 di
X i 0
1 i
i 1
Optimizador no lineal
ln L T 1
d i 2
yi X i'
2
1 d i i X i
'
0
3
2 i 1
2 2 4
1 i 2
40
2. Otra forma de la función de verosimilitud
1
ln L ln 2 ln
2 yi X i'
2
X i'
ln 1
yi 0 2
2
yi 0
(1) (2)
Mezcla de distribuciónes:
discreta y continua
Amemiya (1973): la estimación
Se puede llevar a cabo a través
de MLE
41
Reparametrización de Olsen (1978):
1
Definiendo: ,
Función de verosimilitud:
ln L
yi 0
1
2
ln 2 ln 2 yi X i' ln1 X
2
yi 0
i
' Mayor similitud con la
regresión truncada
42
Método de estimación de Heckman en dos etapas
Pryi 0 1 Pryi 0
•Se define
yi 1 si yi 0
~
yi 0 si yi 0
~
43
1) En una primera etapa puede ser estimado consistentemente por ML en el
Modelo Probit:
Pr~
yi 1 xi'
E yi yi* 0 xi' i
yi xi' i wi
E wi yi 0 0
x
' ~
i
xi'~
i
xi'
Reemplazado por :
Corrección de sesgo
i
xi'~
Estimación Probit
X i' '
E y i X i
X i
X i X i
X i' ' X i'
X i
X i X i
1 2
45
X i' ' X i' Xi
'
1. X i X i
'
X i'
X i X i X i
i i
X i'
X i
i i
X i' i i
Recordar:
i i 1 1
X i exp i2
'
2. i
X i i X i 2 2
- i i
- i i
Donde: Ey i X i X i' i i i i
X i
X
'
i i i i i
i i i i i
i
X
'
i 46
McDonald y Moffitt (1980) sugieren una descomposición útil:
Ey i X i
i 1 i i i i i i
X i
Ey i X i , y i 0 Pry i 0
Pry i 0 Ey i X i , y i 0
X i X i
X i'
donde i i
47
Doble censura:
y i X i' i
y i a si y i a
y i b si y i b
a , b constantes
y i y i en caso contrario
f i función de densidad
F i CDF
i variable aleatoria continua con media 0 y varianza 2
Se tiene:
E yi X i
X i
prob a yi b
48
Tarea revisión de la demostración
i
i y i X i' a X i' y i X i' b X i'
E y a y b X i X E '
i
X
'
b
f d
i
a
F b F a
b
Eyi X i aF a b1 F b F b F a X f d
'
a
i