Becker - Ichino Pscore - Estimación de Los Efectos Promedio Del Tratamiento Basados

Estimación De Los Efectos Promedio Del Tratamiento Basados En Pscore.
Sascha O. Becker
Andrea Ichino
Resumen. En este documento, ofrecemos una breve descripción general de algunos estimadores de
propensión de emparejamiento sugeridos en la literatura de evaluación, y proporcionamos un
conjunto de programas Stata, que ilustramos utilizando la demostración de National Supported
Work (NSW) ampliamente conocida en economía laboral.
1. Introducción
En la literatura de evaluación, los datos a menudo no provienen de ensayos aleatorios, sino de

estudios observacionales (no aleatorizados). En el trabajo seminal, Rosenbaum y Rubin (1983)
propusieron el emparejamiento del puntaje de propensión como un método para reducir el sesgo
en la estimación de los efectos del tratamiento con conjuntos de datos observacionales. Estos
métodos se han vuelto cada vez más populares en los ensayos médicos y en la evaluación de las
intervenciones de política económica.
Ya que, en los estudios observacionales, la asignación de sujetos a los grupos de tratamiento y

control no es aleatoria, la estimación del efecto del tratamiento puede estar sesgada por la
existencia de factores de confusión. La coincidencia de la puntuación de la propensión es una forma
de "corregir" la estimación de los efectos del tratamiento que controlan la existencia de estos
factores de confusión a partir de la idea de que el sesgo se reduce cuando se realiza la comparación
de los resultados utilizando sujetos tratados y de control que son lo más similares posible. Como los
sujetos coincidentes en un vector n-dimensional de características generalmente no son factibles
para una gran n, este método propone resumir las características de pretratamiento de cada sujeto
en una variable de índice único (la puntuación de propensión) que hace que el emparejamiento sea
factible.
En este documento, ofrecemos una breve descripción general de algunos estimadores de

propensión de emparejamiento sugeridos en la literatura de evaluación, y proporcionamos un
conjunto de programas Stata, que ilustramos utilizando la demostración de National Supported
Work (NSW) ampliamente conocida en economía laboral. Al usar estos programas, debe tenerse en
cuenta que solo permiten reducir, y no eliminar, el sesgo generado por factores de confusión no
observables. La medida en que este sesgo se reduce depende fundamentalmente de la riqueza y la
calidad de las variables de control en las que se calcula la puntuación de propensión y se realiza el
emparejamiento. Para ser más precisos, el sesgo se elimina solo si la exposición al tratamiento
puede considerarse puramente aleatoria entre los individuos que tienen el mismo valor de la
puntuación de propensión.
2 El puntaje de propensión
Rosenbaum y Rubin (1983) definen pscore como la probabilidad condicional de recibir un

tratamiento dado las características previas al tratamiento:
𝑝(𝑋) ≡ Pr(𝐷 = 1|𝑋) = 𝐸(𝐷|𝑋) (1)
donde D = {0, 1} es el indicador de exposición al tratamiento y X es el vector multidimensional de las

características del tratamiento previo. Rosenbaum y Rubin (1983) muestran que, si la exposición al
tratamiento es aleatoria dentro de las celdas definidas por X, también es aleatoria dentro de las
celdas definidas por los valores de la variable unidimensional p(X). Como resultado, dada una
población de unidades denotadas por i, si se conoce la puntuación de propensión p(Xi), el efecto
promedio del tratamiento en el tratamiento (ATT) se puede estimar de la siguiente manera:
𝜏 ≡ 𝐸{𝑌1𝑖 − 𝑌0𝑖|𝐷𝑖 = 1}
𝜏 ≡ 𝐸[𝐸{𝑌1𝑖 − 𝑌0𝑖|𝐷𝑖 = 1, p(𝑋𝑖 }]
𝐸[𝐸{𝑌1𝑖|𝐷𝑖 = 1, p(𝑋𝑖 }] − 𝐸[𝐸{𝑌0𝑖|𝐷𝑖 = 0, p(𝑋𝑖 }|𝐷𝑖] (2)
donde la expectativa de salida es sobre la distribución de (p (Xi) | Di = 1) y Y1i y Y0i son los resultados
potenciales en las dos situaciones contrafactuales de tratamiento (respectivamente) y sin
tratamiento.
Formalmente, se necesitan las siguientes dos hipótesis para derivar (2) dada (1) .1
Lema 1 Balanceando las variables de pretratamiento dada la puntuación de propensión.
Si p(X) es el puntaje de propensión, entonces:
𝐷 ⊥ 𝑋 | 𝑝(𝑋)
Lema 2 Desconcierto dado el puntaje de propensión.
Supongamos que la asignación al tratamiento no tiene fundamento; es decir.,
𝑌1 , 𝑌0 ⊥ 𝐷 | 𝑋
Luego, la asignación al tratamiento no tiene fundamento dado el puntaje de propensión, es decir,
𝑌1 , 𝑌0 ⊥ 𝐷 | 𝑝(𝑋)
Si se cumple la hipótesis de equilibrio del Lema 1, las observaciones con el mismo puntaje de
propensión deben tener la misma distribución de características observables (y no observables)
independientemente del estado del tratamiento. En otras palabras, para un puntaje de propensión
dado, la exposición al tratamiento es aleatoria y, por lo tanto, las unidades tratadas y de control
1
See Rosenbaum and Rubin (1983) or Imbens (2000) for a proof.
deben ser en promedio observadas idénticas. Se puede usar cualquier modelo de probabilidad
estándar para estimar la puntuación de propensión.
Por ejemplo, Pr (𝐷𝑖 = 1 | 𝑋𝑖) = F {h (𝑋𝑖)}, donde F (.) Es la distribución acumulativa normal o logística
y h (𝑋𝑖) es una función de covariables con términos lineales y de orden superior.
La elección de qué términos de orden superior incluir se determina únicamente por la necesidad de
obtener una estimación del puntaje de propensión que satisfaga la Hipótesis de Equilibrio. Dado
que la especificación de h(𝑋𝑖) que satisface la hipótesis de equilibrio es más parsimoniosa que el
conjunto completo de interacciones necesarias para hacer coincidir los casos y los controles sobre
la base de observables, el puntaje de propensión reduce el problema de dimensionalidad de las
unidades tratadas y de control en el base del vector multidimensional X2.
El programa pscore.ado estima la puntuación de propensión y prueba la Hipótesis de Balanceo

(Lema 1) de acuerdo con el siguiente algoritmo3:
1. Ajuste el modelo probit (o logit):

𝑃𝑟(𝐷𝑖 = 1|𝑋𝑖 ) = 𝛷{ℎ(𝑋𝑖 )}
donde 𝛷 denota el coeficiente normal (logístico) y ℎ(𝑋𝑖 ) es una especificación inicial que
incluye todas las covariables como términos lineales sin interacciones o términos de orden
superior.
2. Divida la muestra en k intervalos igualmente espaciados de la puntuación de propensión,
donde k es determinado por el usuario y el valor predeterminado es 5.
3. Dentro de cada intervalo, compruebe que la puntuación de propensión media de las
unidades tratadas y de control no difiera.
4. Si la prueba falla en un intervalo, divídalo por la mitad y vuelva a realizar la prueba.
5. Continuar hasta que, en todos los intervalos, el puntaje promedio de propensión de las
unidades tratadas y de control no difiera.
6. Dentro de cada intervalo, compruebe que las medias de cada característica no difieran entre
las unidades tratadas y las de control. Esta es una condición necesaria para la Hipótesis de
Equilibrio4.
7. Si las medias de una o más características difieren, informe al usuario que la propiedad de
equilibrio no está satisfecha y que se necesita una especificación menos parsimonia de (Is).
Los pasos 2 a 7 del algoritmo se pueden restringir al soporte común. Esta restricción implica que la
prueba de la propiedad de equilibrio se realiza solo en las observaciones cuya puntuación de
2
Es importante tener en cuenta que el resultado no juega ningún papel en el algoritmo para la estimación
de la puntuación de propensión. Esto es equivalente, en este contexto, a lo que sucede en experimentos
controlados en los que el diseño del experimento debe especificarse independientemente del resultado.
3
Tenga en cuenta que la hipótesis de desconcierto del lema 2 no se puede probar.
4
Tenga en cuenta que no es suficiente en el sentido de que el equilibrio puede no ser válido para los
momentos de orden superior de la distribución de características. Entonces, para ser precisos, el programa
no prueba la Hipótesis de Equilibrio, sino solo una de sus implicaciones. En futuras versiones del programa
planeamos agregar pruebas para momentos más altos de la distribución de características.
propensión pertenece a la intersección de los soportes de la puntuación de propensión de los
tratados y los controles. Imponer la condición de soporte común en la estimación de la puntuación
de propensión puede mejorar la calidad de las coincidencias utilizadas para estimar el ATT5.
3 Estimadores Coincidentes del ATT en Función de la Puntuación de Propensión
Una estimación del puntaje de propensión no es suficiente para estimar el ATT de interés usando
(2). La razón es que la probabilidad de observar dos unidades con exactamente el mismo valor de la
puntuación de propensión es en principio cero, ya que p (X) es una variable continua. Se han
propuesto varios métodos en la literatura para superar este problema, y cuatro de los más utilizados
son la concordancia del vecino más cercano, la concordancia de radio, la concordancia de kernel y
la concordancia de estratificación.
A partir de este último, el método de estratificación consiste en dividir el rango de variación de la

puntuación de propensión en intervalos tales que, en cada intervalo, las unidades tratadas y de
control tienen en promedio la misma puntuación de propensión. Para propósitos prácticos, se
pueden usar los mismos bloques identificados por el algoritmo que estima la puntuación de
propensión. Luego, dentro de cada intervalo en el que están presentes tanto las unidades tratadas
como las de control, se calcula la diferencia entre los resultados promedio de los tratados y los
controles. El ATT de interés se obtiene finalmente como un promedio del ATT de cada bloque con
los pesos dados por la distribución de las unidades tratadas en los bloques.
Uno de los inconvenientes del método de estratificación es que descarta las observaciones en
bloques donde faltan unidades tratadas o de control. Esta observación sugiere una forma alternativa
de hacer coincidir las unidades tratadas y de control, que consiste en tomar cada unidad tratada y
buscar la unidad de control con el puntaje de propensión más cercano; es decir, el vecino más
cercano. Aunque no es necesario, el método generalmente se aplica con reemplazo, en el sentido
de que una unidad de control puede ser la mejor opción para más de una unidad tratada. Una vez
que cada unidad tratada se hace coincidir con una unidad de control, se calcula la diferencia entre
el resultado de las unidades tratadas y el resultado de las unidades de control emparejadas. El ATT
de interés se obtiene promediando estas diferencias.
Mientras que, en el método de estratificación, puede haber unidades tratadas que se descartan
porque no hay control disponible en su bloque; en el método Vecino más cercano, todas las
unidades tratadas encuentran una coincidencia. Sin embargo, es obvio que algunas de estas
coincidencias son bastante deficientes porque para algunas unidades tratadas el vecino más cercano
puede tener una puntuación de propensión muy diferente y, sin embargo, contribuiría a la
estimación del efecto del tratamiento independientemente de esta diferencia. Los métodos de
Radius Matching y Kernel Matching ofrecen una solución a este problema. Con Radius Matching,
cada unidad tratada se compara solo con las unidades de control cuyo puntaje de propensión cae
en un vecindario predefinido del puntaje de propensión de la unidad tratada. Si se establece que la
dimensión de la vecindad (es decir, el radio) es muy pequeña, es posible que algunas unidades
5
Consulte la siguiente sección para obtener más información sobre la condición de soporte común.
tratadas no coincidan porque la vecindad no contiene unidades de control. Por otro lado, cuanto
menor sea el tamaño del vecindario, mejor será la calidad de los partidos. Con Kernel Matching,
todos los tratados se comparan con un promedio ponderado de todos los controles con pesos que
son inversamente proporcionales a la distancia entre las puntuaciones de propensión de los
tratados y los controles.
De las consideraciones anteriores se desprende claramente que estos cuatro métodos alcanzan
diferentes puntos en la frontera de la compensación entre la calidad y la cantidad de los partidos, y
ninguno de ellos es a priori superior a los otros. Su consideración conjunta, sin embargo, ofrece una
manera de evaluar la solidez de las estimaciones.
También se debe tener en cuenta que, con todos estos métodos, la calidad de los emparejamientos
puede mejorarse imponiendo la restricción de soporte común. Sin embargo, tenga en cuenta que
de esta manera se pueden perder coincidencias de alta calidad en los límites del soporte común y
que la muestra puede reducirse considerablemente, por lo que imponer la restricción del soporte
común no es necesariamente mejor (consulte Lechner 2001). Todos nuestros programas permiten
la opción de soporte común como se explica a continuación.
Ahora pasamos a una descripción más detallada y formal de estos estimadores. Comenzamos con
el análisis conjunto de la concordancia del vecino más cercano y la concordancia del radio, que se
pueden describir en un marco común, al lado de la concordancia del núcleo y la concordancia de la
estratificación.
Coincidencia de vecinos más cercanos (attnd.ado y attnw.ado) y Coincidencia de radio (attr.ado)
Sea T el conjunto de unidades tratadas y C el conjunto de unidades de control, y sean 𝑌𝑖𝑇 e 𝑌𝑖𝐶 los
resultados observados de las unidades tratadas y de control, respectivamente. Indique por 𝐶(𝑖) el
conjunto de unidades de control emparejadas con la unidad tratada i con un valor estimado de la
puntuación de propensión de 𝑝(𝑖). Conjuntos coincidentes vecinos más cercanos
𝐶(𝑖) = min ||𝑝𝑖 − 𝑝𝑗 ||

𝑗
eso es un solo en conjunto a menos que haya varios vecinos más cercanos. En la práctica, el caso de
múltiples vecinos más cercanos debería ser muy raro, en particular si el conjunto de características
X contiene variables continuas. La probabilidad de que haya varios vecinos más cercanos se reduce
aún más si la puntuación de propensión se estima y se guarda con doble precisión.
En radio coincidente,
𝐶(𝑖) = {𝑝𝑗 | ||𝑝𝑖 − 𝑝𝑗 || < 𝑟
es decir, todas las unidades de control con puntajes de propensión estimados que caen dentro de
un radio 𝑟 desde 𝑝(𝑖) se comparan con la unidad tratada 𝑖.
Tanto el vecino más cercano como el radio coinciden indican el número de controles coincidentes
1
con la observación 𝑖 ∈ 𝑇 para 𝑁𝑖𝐶 y definir los pesos 𝑤𝑖𝑗 = si 𝑗 ∈ 𝐶(𝑖) y 𝑤𝑖𝑗 = 0
𝑁𝑖𝐶
de otra manera. Luego, la fórmula para ambos tipos de estimadores coincidentes se puede escribir
de la siguiente manera:
1
𝜏𝑀 = ∑ (𝑌𝑖𝑇 − ∑ 𝑤𝑖𝑗 𝑌𝑗𝐶 )
𝑁𝑇
𝑖𝜖𝑇 𝑗𝜖𝐶(𝑖)
1
𝜏𝑀 = (∑ 𝑌𝑖𝑇 − ∑ ∑ 𝑤𝑖𝑗 𝑌𝑗𝐶 )
𝑁𝑇
𝑖𝜖𝑇 𝑗𝜖𝐶(𝑖) 𝑖𝜖𝑇
1 1
𝜏𝑀 = 𝑇
∑ 𝑌𝑖𝑇 − 𝑇 ∑ 𝑤𝑗 𝑌𝑗𝐶
𝑁 𝑁
𝑖𝜖𝑇 𝑗𝜖𝐶
(donde M representa la concordancia del vecino más cercano o la coincidencia del radio, y el número
de unidades en el grupo tratado se denota por 𝑁 𝑇 ): donde los pesos wj se definen por wj = Σiwij.
Para derivar las variaciones de estos estimadores, se asume que las ponderaciones son fijas y se
asume que los resultados son independientes entre las unidades.
1 2
𝑉𝑎𝑟(𝜏 𝑀 ) = 𝑇 2 {∑ 𝑉𝑎𝑟 (𝑌𝑖𝑇 ) + ∑(𝑤𝑗 ) 𝑉𝑎𝑟 (𝑌𝑗𝐶 )}
(𝑁 )
𝑖𝜖𝑇 𝑗∈𝐶
1 2
= {𝑁 𝑇 𝑉𝑎𝑟(𝑌𝑖𝑇 ) + ∑(𝑤𝑗 ) 𝑉𝑎𝑟 (𝑌𝑗𝐶 )}
(𝑁 𝑇 )2
𝑗∈𝐶
1 1 2
= 𝑇
𝑉𝑎𝑟(𝑌𝑖𝑇 ) + 𝑇 2 ∑(𝑤𝑗 ) 𝑉𝑎𝑟 (𝑌𝑗𝐶 )
𝑁 (𝑁 )
𝑗∈𝐶
En los programas attnd.ado, attnw.ado y attr.ado, los errores estándar se obtienen analíticamente
con la fórmula anterior o con la opción bootstrap.
La diferencia entre attnd.ado y attwn.ado se entiende más fácilmente describiendo brevemente la

forma en que los vecinos más cercanos se determinan computacionalmente en los dos programas.
Para ahorrar tiempo de computación, los vecinos más cercanos no se determinan comparando las
observaciones tratadas con cada control individual, sino más bien clasificando primero todos los
registros por la puntuación de propensión estimada, y luego buscando las unidades de control más
cercanas hacia adelante y hacia atrás. Si, para una unidad tratada, las coincidencias hacia adelante
y hacia atrás resultan ser igualmente buenas, existen dos opciones computacionalmente factibles
para obtener errores analíticos estándar y al mismo tiempo explotar la estrategia de búsqueda muy
rápida hacia adelante y hacia atrás: attnw.ado otorga el mismo peso ( por lo tanto, las letras "nw"
para el vecino más cercano y el mismo peso) a los grupos de coincidencias hacia adelante y hacia
atrás; attnd.ado dibuja aleatoriamente las coincidencias hacia adelante o hacia atrás (por lo tanto,
las letras "nd" para el vecino más cercano y el sorteo aleatorio). En la práctica, el caso de múltiples
vecinos más cercanos debería ser muy raro, especialmente si el conjunto de X contiene variables
continuas, en cuyo caso tanto attnw.ado como attnd.ado deberían dar resultados iguales. La
probabilidad de que existan múltiples vecinos más cercanos se reduce aún más si la puntuación de
propensión se estima y se guarda con doble precisión, que es lo que hace pscore.ado de forma
predeterminada.
Método de emparejamiento del kernel (attk.ado)
El estimador de coincidencia de Kernel es dado por:
𝑃𝑗 − 𝑃𝑖
1 ∑𝑗∈𝐶 𝑌𝐼𝐶 𝐺(
)
𝑀 𝑇 ℎ𝑛
(𝑇 ) = 𝑇 ∑{ 𝑌𝑖 − }
𝑁 𝑃 − 𝑃𝑖
𝑖∈𝑇 ∑𝑘∈𝐶 𝐺( 𝑘 )
ℎ𝑛
donde G (·) es una función del Kernel y ℎ𝑛 es un parámetro de ancho de banda. Bajo condiciones
estándar en el ancho de banda y el kernel,
𝑃𝑗 − 𝑃𝑖
∑𝑗∈𝐶 𝑌𝐼𝐶 𝐺( )
ℎ𝑛
𝑃 − 𝑃𝑖
∑𝑘∈𝐶 𝐺( 𝑘 )
ℎ𝑛
es un estimador consistente del resultado contrafactual 𝑌0𝑖 . En el programa attk.ado, los errores
estándar se obtienen al arrancar usando la opción bootstrap. Los usuarios pueden elegir el Kernel
gaussiano predeterminado o el Kernel Epanechnikov.
6 Ejemplo: NSW - datos PSID
Utilizamos datos de Dehejia y Wahba (1999), DW para abreviar, que se basan en el estudio seminal
de Lalonde (1986) de la comparación entre los métodos experimentales y no experimentales para
la evaluación de los efectos causales. Los datos combinan las unidades tratadas de una evaluación
aleatoria de la demostración del Trabajo Nacional Apoyado (NSW) con unidades de comparación no
experimentales extraídas de los datos de la encuesta. Para los fines de esta sección, restringimos
nuestro análisis a la denominada submuestra NSW-PSID-1, que consta de las unidades de
tratamiento masculinas de NSW y la mayor de las tres submuestras de PSID (consulte DW99 para
obtener más detalles). Utilizamos este conjunto de datos por dos razones: primero, es ampliamente
conocido en economía laboral (comenzando con Lalonde (1986), analizado nuevamente por Dehejia
y Wahba (1999 y 2002) y por Smith y Todd (2003) para ilustrar el trabajo de puntaje de propensión
y técnicas de emparejamiento. En segundo lugar, los datos están disponibles públicamente en el
sitio web de Rajeev Dehejia bajo la siguiente dirección:
http://www.columbia.edu/˜rd247/nswdata.html. Intentamos replicar los resultados producidos
por Dehejia y Wahba (1999) pero, al igual que Smith y Todd (2003), no hemos podido replicar
numéricamente todas sus estimaciones debido a la falta de información detallada en algunos casos
cruciales (por ejemplo, número de bloques utilizados en la estratificación, niveles de significación,
procedimiento exacto para probar la propiedad de balanceo). Sin embargo, obtenemos resultados
cualitativamente similares. El resultado de interés es RE78 (ganancias reales en 1978); El
tratamiento T es la participación en el grupo de tratamiento de NSW. Las variables de control son
edad, educación, negro (1 si es negro, 0 de lo contrario), hispano (1 f hispano, 0 de lo contrario),
casado (1 si está casado, 0 de lo contrario), nodegree (1 si no hay título, 0 de lo contrario), RE75
(ganancias en 1975), y RE74 (ganancias en 1974). El grupo de tratamiento contiene 185
observaciones y el grupo de control contiene 2,490 observaciones, por lo que el número total de
observaciones es 2,675.
6.1 Salida desde pscore
La salida de ejecutar pscore usando la especificación DW99 es la siguiente:

Siguiendo el algoritmo descrito en la Sección 2, los bloques para los cuales difieren las puntuaciones
de propensión promedio de los tratados y los controles se dividen por la mitad. El algoritmo continúa
hasta que, en todos los bloques, el puntaje promedio de propensión de los tratados y los controles
no difiere. En nuestro caso, esto sucede por un número de siete bloques. A partir de entonces,
pscore procede a la prueba de la propiedad de equilibrio para cada covariable.
Cuando no se especifica la opción de detalle, la única salida producida por pscore es una declaración
que indica si se cumple la propiedad de compensación (que es el caso de los datos DW con p = 0,005)
o no. En este último caso, se informa al usuario para qué variable (s) en qué bloque (es) falló la
propiedad de balanceo, y se emite un mensaje que sugiere que se intente una especificación
diferente de la puntuación de propensión.
En caso de que se mantenga la propiedad de equilibrio, la distribución final de los controles tratados
y entre bloques se tabula junto con la parte inferior de cada bloque:
Tenga en cuenta que impusimos la condición de soporte común en este ejemplo usando la opción
comsup. En consecuencia, faltan identificadores de bloque para las observaciones de control fuera
del soporte común, y el número de observaciones en la tabla es de 1.342 en lugar de 2.675.
Después de ejecutar pscore, los usuarios pueden proceder a estimar los efectos promedio del
tratamiento utilizando uno de los programas att *.
6.2 Salida de attnd y attnw
La salida típica de attnd o attnw es

Tenga en cuenta que, en este ejemplo, solo 57 controles diferentes se han comparado con los 185
tratados. Estos resultados son muy similares a los obtenidos por Dehejia y Wahba (1999).
6.3 Salida de attr
Para attr con radio r = 0.0001 obtenemos:

La gran diferencia con respecto a los resultados de coincidencia de calibre de Dehejia y Wahba
(2002) se debe al hecho de que la coincidencia de calibrador difiere de la coincidencia de radio en
que el control más cercano se usa como coincidencia si una unidad tratada no tiene unidades de
control dentro del radio r. Mientras que la coincidencia de calibre usa todas las unidades tratadas,
nuestro método solo usa aquellas tratadas que tienen coincidencias de control dentro del radio r
(aquí, 23 de 185 tratados). Este ejemplo ilustra la sensibilidad de los resultados a los supuestos
extremos utilizados en el procedimiento de comparación. Si se elige que el radio sea muy pequeño,
muchas unidades tratadas no coinciden y los resultados ya no son representativos de la población
de tratados. Para una discusión más detallada de este problema, vea Smith y Todd (2003).
6.4 Salida de attk
Para attk, los resultados son los siguientes:

En la concordancia de kernel, se utilizan todos los controles, así como todos los controles (en el
soporte común que se ha impuesto aquí). La estimación del ATT es bastante cercana a la obtenida
con la comparación del vecino más cercano.
6.5 Salida de atts
Finalmente, para atts con los bloques obtenidos en pscore:

Aquí, la diferencia con respecto a los resultados de DW99 es ligeramente mayor que para la
coincidencia del vecino más cercano. Esto podría explicarse por un número diferente de bloques
utilizados en la estratificación, diferentes niveles de significación o un procedimiento diferente para
probar la propiedad de equilibrio (vea la observación general al principio de la sección 6). Pero en
general, los resultados obtenidos por attnw, attk y atts son bastante cercanos entre sí y, en
conjunto, evidencian un ATT positivo en el rango de 1500 a 2200 asociado con la demostración de
NSW (cuando se evalúa con grupos de comparación no experimentales), que está cerca de las
estimaciones experimentales de alrededor de 1700.

Becker - Ichino Pscore - Estimación de Los Efectos Promedio Del Tratamiento Basados

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Becker - Ichino Pscore - Estimación de Los Efectos Promedio Del Tratamiento Basados

Cargado por

Copyright:

Formatos disponibles

Estimación De Los Efectos Promedio Del Tratamiento Basados En Pscore.

En la literatura de evaluación, los datos a menudo no provienen de ensayos aleatorios, sino de

Ya que, en los estudios observacionales, la asignación de sujetos a los grupos de tratamiento y

En este documento, ofrecemos una breve descripción general de algunos estimadores de

Rosenbaum y Rubin (1983) definen pscore como la probabilidad condicional de recibir un

𝑝(𝑋) ≡ Pr(𝐷 = 1|𝑋) = 𝐸(𝐷|𝑋) (1)

donde D = {0, 1} es el indicador de exposición al tratamiento y X es el vector multidimensional de las

𝜏 ≡ 𝐸[𝐸{𝑌1𝑖 − 𝑌0𝑖|𝐷𝑖 = 1, p(𝑋𝑖 }]

𝐸[𝐸{𝑌1𝑖|𝐷𝑖 = 1, p(𝑋𝑖 }] − 𝐸[𝐸{𝑌0𝑖|𝐷𝑖 = 0, p(𝑋𝑖 }|𝐷𝑖] (2)

Lema 1 Balanceando las variables de pretratamiento dada la puntuación de propensión.

Si p(X) es el puntaje de propensión, entonces:

Lema 2 Desconcierto dado el puntaje de propensión.

Supongamos que la asignación al tratamiento no tiene fundamento; es decir.,

Luego, la asignación al tratamiento no tiene fundamento dado el puntaje de propensión, es decir,

El programa pscore.ado estima la puntuación de propensión y prueba la Hipótesis de Balanceo

1. Ajuste el modelo probit (o logit):

3 Estimadores Coincidentes del ATT en Función de la Puntuación de Propensión

A partir de este último, el método de estratificación consiste en dividir el rango de variación de la

Coincidencia de vecinos más cercanos (attnd.ado y attnw.ado) y Coincidencia de radio (attr.ado)

𝐶(𝑖) = min ||𝑝𝑖 − 𝑝𝑗 ||

𝐶(𝑖) = {𝑝𝑗 | ||𝑝𝑖 − 𝑝𝑗 || < 𝑟

La diferencia entre attnd.ado y attwn.ado se entiende más fácilmente describiendo brevemente la

Método de emparejamiento del kernel (attk.ado)

El estimador de coincidencia de Kernel es dado por:

6 Ejemplo: NSW - datos PSID

6.1 Salida desde pscore

La salida de ejecutar pscore usando la especificación DW99 es la siguiente:

6.2 Salida de attnd y attnw

La salida típica de attnd o attnw es

6.3 Salida de attr

Para attr con radio r = 0.0001 obtenemos:

6.4 Salida de attk

Para attk, los resultados son los siguientes:

6.5 Salida de atts

Finalmente, para atts con los bloques obtenidos en pscore:

También podría gustarte