Está en la página 1de 13

Tarea BLP - Organización Industrial

Juan David Martin Ocampo

7 de diciembre de 2013

1. Introducción

El objetivo de este trabajo es explorar el desempeño del método propuesto por Berry, Le-
vinsohn, y Pakes (1995), BLP, para la estimación de demanda con bienes diferenciados. Para
ello, se realiza un conjunto de simulaciones en el que se estructuran dos posibles escenarios: 1)
el caso con consumidores homogéneos y 2) considerando gustos heterogéneos. Con el análisis
del primer caso se evalúa la pertinencia del uso de variables instrumentales para el precio,
estimando los parámetros vía Mínimos Cuadrados Ordinarios (MCO) y Variables Instrumen-
tales (VI). Por otra parte, con el segundo análisis se verifica directamente el desempeño del
método propuesto por BLP, estimando los parámetros, primero con el modelo logit que asume
homogeneidad entre consumidores y luego usando coeficientes aleatorios.

La estructura del trabajo se divide en seis secciones principales, incluyendo la presente intro-
ducción. A continuación se hace una descripción breve del modelo presentado en BLP. Luego,
en la sección 3 se presenta la metodología de estimación empleadas. La sección 4, presenta el
proceso de simulación y ciertas características de los datos generados. En seguida, se presentan
los resultados de estimación y en la última sección se incluyen unos comentarios finales.

2. Modelo

En esta sección se describe brevemente la estructura general del modelo de elección discreta
presentado en BLP.

El planteamiento inicial considera el problema de elección del consumidor i ∈ {1, . . . , N }, quien


percibe un nivel de utilidad uij al comprar el bien j ∈ {1, . . . , J} en el mercado t ∈ {1, . . . , T }

uijt = xjt β i − αi pjt + ξjt + ijt , (1)

donde xjt es un vector fila que indica las K características del producto observadas en el
mercado t, β i es el vector de coeficientes aleatorios que describen la utilidad marginal asociada
de cada una de las K características. Mientras que αi es la “desutilidad” marginal asociada al

1
precio pjt . Por otra parte, ξjt representa las características no observadas (por el econometrista)
del producto j en el mercado t, conocidas por cualquier consumidor. Finalmente, ijt es un
choque ideosincrático distinto para cada consumidor, cada producto y cada mercado.

De acuerdo con lo anterior, consumidor i elije el bien j si y sólo si la utilidad generada por
éste supera a cualquier otra opción. Siguiendo a Nevo (2000), lo anterior define un conjunto
de atributos individuales independientes que de implican la elección por j

Ajt = {(αi , β i , ijt ) | uijt ≥ uij 0 t , ∀j 0 6= j}.

Entonces, aplicando la regla de Bayes la probabilidad de que cualquier consumidor compre el


bien j en el mercado t está dada por

R
sjt = Aij dP (αi , β i , ijt )
R
= Aij dP (αi )dP (β i )dP (ijt ),

donde P (•) denota la función de densidad de la población. En particular, denotando definiendo


j = 0 como la decisión de no comprar nada (el outside option) y asumiendo que ijt se
distribuye idéntica e independientemente (iid ) valor extremo tipo I, la cuota de mercado
asociada al bien j puede expresarse como

exp(xjt β i − αi pjt + ξjt )


Z
sjt (xjt , pjt , ξjt ; θ) = PJ dP (αi )dP (β i ), (2)
l=0 exp(xlt β i − αi plt + ξlt )

donde θ = (αi , β i ). Si el modelo está bien especificado, debe cumplirse que las cuotas que
predice (2) sean iguales a las observadas, Sjt . Así, las cantidades de equilibrio se definen en
términos de la cuota de mercado y del tamaño del mercado potencial M :

qjt (xjt , pjt , ξjt ) = sjt (xjt , pjt , ξjt ) · M. (3)

La estructura del modelo es menos compleja por el lado de la oferta. Aquí se asume un conjunto
de F firmas, donde cada firma f se dedica a la producción exclusiva de un subconjunto de
bienes Ff sobre el total en la economía. En equilibrio estático f elije un nivel de producción
qjt , ∀j ∈ Ff . De esta forma los beneficios de f , en cada mercado t tienen una forma reducida
dada por

P
Πf = j∈Ff (pjt − cmj ) · qjt
P (4)
= j∈Ff (pjt − cmj ) · sjt (xjt , pjt , ξjt ; θ) · M,

2
donde cmj son los costos marginales de producir j, los cuales se asumen iguales para cada
firma en cada mercado. De acuerdo con esto, las condiciones de primer orden asociadas a la
elección del precio del bien j se resumen en:

X ∂srt (xrt , prt , ξrt ; θ)


sjt (xjt , pjt , ξjt ; θ) + (prt − cmr ) = 0. (5)
∂pjt
r∈Ff

Como puede notarse las condiciones de equilibrio dependen en esencia del problema del con-
sumidor, es decir, de sjt (xjt , pjt , ξjt ; θ).

3. Estimación

La estimación de este modelo representa un reto importante, principalmente cuando αi y β i son


distintos entre consumidores. En esta sección se describe brevemente el proceso de estimación
de los parámetros de demanda, de acuerdo con dos casos específicos: cuando (αi , β i ) = (α, β)
y cuando (αi , β i ) = (α, β + σvi ); donde σ es un parámetro a estimar y vik ∼ N (0, 1), k =
1, . . . , K. Mientras en el primer caso se asume un escenario con consumidores homogéneos, en
el segundo se considera cierta heterogeneidad en el gusto por las K características observables.
Para simplificar la notación se asume un único mercado.

3.1. Modelo Logit

Para el primer caso, se siguen los lineamientos presentados por Berry (1994). En primer lugar,
dados los supuestos sobre los parámetros, se reescribe la ecuación (1) como

uij = δj + ij , (6)

donde δj ≡ xj β − αpj + ξj se denota como la utilidad media asociada a la compra del bien
j, igual entre consumidores. De esta forma, normalizando δ0 = 0 la ecuación de la cuota de
mercado del bien j que describe (2) se simplifica en términos de un modelo logit multinomial

exp(δj )
sj (xj , pj , ξj ; θ) = PJ . (7)
1 + l=1 exp(δl )

En este orden de ideas, si el modelo está bien especificado, se cumple que sj (xj , pj , ξj ; θ) = Sj ,
entonces se puede resolver (7) para δj de forma que

δj = ln(Sj ) − ln(S0 ). (8)

3
Una vez se obtiene un vector de utilidad media asociado a las cuotas del mercado observadas,
es posible estimar α y β por medio de una regresión lineal tradicional (ya sea por MCO o por
VI) para la siguiente ecuación:

δj = φ + xj β − αpj + ξj . (9)

La constante φ, además de reducir un posible sesgo, captura el cambio de nivel en la utilidad


media resultante de la transformación monótona implícita luego de normalizar δ0 .

3.2. Modelo con coeficientes aleatorios

En el segundo caso, se considera un coeficiente aleatorio para los gustos asociados a las caracte-
rísticas con una forma β i = β + σvi ). En este orden de ideas la ecuación (1) puede reescribirse
como

uij = xj (β + σvi )) − αpj + ξj + ij

= xj β + σxj vi − αpj + ξj + ij (10)

= δj + µij + ij

donde µijt ≡ σxjt vi . En este orden de ideas, (2) adquiere una forma no tan sencilla como en
el caso anterior

Z
exp(δj + µij )
sj (xj , pj , ξj ; θ) = PJ dP (vi ). (11)
1 + l=1 exp(δl + µil )

En este caso, para la estimación de θ = (α, β, σ) se sigue el algoritmo de estimación propuesto


en BLP, el cual se estructura de la siguiente manera:

1. Se fija un valor inicial para el vector de parámetros θ0 = (α0 , β 0 , σ0 ).


sim ∼ N (0, 1),
2. Se generan NS simulaciones de vi , denotadas como visim , asumiendo que vik
para todo k = 1, . . . , K.

3. A partir de los valores iniciales α0 y δ 0 se genera un vector de utilidad media inicial, δ 0 .

4. Luego, dados visim , δ 0 y σ0 , se computa un vector de cuotas de mercado, Spj , aproximando


el valor de la integral en (11) como un promedio muestral

NS
1 X exp(δj0 + µsim
ij )
Spj (σ0 ) = PJ , con µsim sim
ij ≡ σ0 xj vi .
NS 0 sim
i=1 1 + l=1 exp(δl + µil )

4
5. A continuación, se computa un nuevo vector de utilidad media, δ 1 , en conformidad con
la ecuación de punto fijo sugerida por BLP.

δj1 = δj0 + ln(Sj ) − ln(Spj )

Este paso se repite H veces, hasta que k ln(Sj )−ln(Spj )k sea menor a un nivel de tolerancia
arbitrario (preferiblemente pequeño).

δjh = δjh−1 + ln(Sj ) − ln(Spj ), h = 1, . . . , H.

6. Una vez generado el vector δ H , se obtienen α̂(σ0 ) y β̂(σ0 ) por medio de una regresión
lineal para (9), vía MCO o VI según corresponda.

7. Luego, se computa ξ̂(σ0 ) como el vector de residuos de la regresión lineal anterior y se


construye la función de criterio

G(σ0 ) = ξ̂(σ0 )0 ZAZ 0 ξ̂(σ0 ),

donde Z es una matriz cuyas columnas corresponden a una seria de variables instrumen-
tales y A = (Z 0 Z)−1 es la matriz de ponderaciones.

Este proceso se repite desde el numeral 3, para diferentes valores de σ, hasta que G(σ) se
minimiza. En particular, el estimador de σ por Método Generalizado de Momentos (GMM)
está dado por

σ̂GMM = arg max G(σ) (12)


σ

De esta forma, la estimación de θ se obtiene en función únicamente de σ.

4. Simulación y datos

En esta sección se describe el proceso de simulación por el cual se generan los datos. En
general, se adoptan especificaciones consistentes con lo presentado en BLP y Berry (1994). En
este orden de ideas, se consideran N = 10, 000 consumidores, J = 100 productos, un único
mercado y número de características K = 1.

Asimismo, la utilidad media es generada por

δj = βxj − αpj + ξj , ∀j = 1, 2, . . . , 100,

5
donde xj = j y ξj ∼ U (0, 1). Por otra parte, se genera un vector de precios que depende
tanto de las características observadas y no observadas, como de un conjunto de variables
Γ = {z1 , z2 , z3 }.

3
X
p j = ψ + λ 1 x j + λ 2 ξj + γ` z`j + ωj , ∀j = 1, 2, . . . , 100,
`=1

con ωj ∼ N (0, 1) y cada una de las variables de Γ en función de un término ε` ∼ iid N (0, 1).
Específicamente, z1 , z2 y z3 están dadas por

q
z1j = ε1j , z2j = ε22j , z3j = |ε3j |,

Debe notarse que, si bien pj no depende directamente de las cantidades demandadas, esta
especificación incorpora un cierto grado de endogeneidad en el precio, en el sentido de que éste
depende directamente de la características no observadas, ξj , que intervienen en la demanda.

Acto seguido, se construye el vector de las cuotas de mercado observadas tomando N como el
tamaño total de la población. Dado que se cuenta con la población total, y de acuerdo con la
especificación adoptada, la ecuación (2) puede escribirse de forma equivalente como

N
1 X exp(δj + µij )
Sj = PJ ,
N δ0 + l=1 exp(δ l + µ il )
i=1

donde µij ≡ σxj vi con vi ∼ N (0, 1) y δ0 es fijado de tal forma que por lo menos el 20 % de los
consumidores decidan no consumir ningún producto, es decir, S0 ≥ 0.2.

Cuadro 1: Parámetros elegidos para simulación

Parámetro Caso I Caso II


α 0.20 0.20
β 0.33 0.33
λ1 0.10 0.10
λ2 4.67 4.67
γ1 0.67 0.67
γ2 0.00 -0.40
γ3 0.00 0.50
ψ 5.00 5.00
σ 0.00 0.25

Fuente: Elaboración propia

6
Finalmente, el valor de los parámetros se especifica de forma que se generen los dos escenarios
que se analizan en este trabajo: con consumidores homogéneos y considerando heterogeneidad
en los gustos por las características observadas. En el Cuadro 1 se presentan los valores elegidos
para la simulación de cada caso.

En los Cuadros 2 y 3 se presentan algunas estadísticas descriptivas para los datos simulados
de acuerdo al primer y segundo caso, respectivamente.

Cuadro 2: Estadísticas descriptivas, Caso I

Desviación
Variable Media estándar Mínimo Máximo
pj 12.43 3.32 4.91 19.87
xj 50.50 29.01 1 100
Sj 0.01 0.03 0.00 0.23
δ 14.87 9.10 -0.53 30.78
z1j -0.04 1.00 -2.66 2.32
ξj 0.52 0.25 0.00 0.98
ωj -0.02 0.84 -1.74 2.18

Fuente: Elaboración propia

Cuadro 3: Estadísticas descriptivas, Caso II

Desviación
Variable Media estándar Mínimo Máximo
pj 12.11 3.49 4.81 19.93
xj 50.50 29.01 1 100
Sj 0.01 0.04 0.00 0.32
δ 14.87 9.10 -0.80 30.75
z1j -0.03 0.99 -2.46 2.70
z2j 0.76 1.08 0.00 6.68
z3j 0.89 0.34 0.08 1.75
ξj 0.46 0.28 0.02 0.99
ωj -0.19 1.04 -2.55 2.23

Fuente: Elaboración propia

7
5. Resultados

En esta sección se presentan los resultados de las estimaciones de los parámetros de demanda,
teniendo en cuenta cada uno de los dos casos. En ambos se siguen los lineamientos descritos
en la sección 3.

5.1. Caso I: Consumidores homogéneos

Para la estimación de α y β en el escenario con consumidores homogéneos, se recurre al modelo


logit, usando separadamente MCO (α̂MCO y β̂MCO ) y VI (α̂VI y β̂VI ). Para la estimación vía
VI se toma como principal instrumento la variable z1j ya que, por construcción, no está
correlacionada con xij . Junto con ésta se incluyen xj y el vector de unos dentro de la matriz
de instrumentos Z.

Cuadro 4: Resultados Caso I

Modelo Logit
Variable MCO VI
Constante -31.40 *** -30.53 ***
(0.09) (0.21)

xj 0.32 *** 0.33 ***


(0.01) (0.01)

pj -0.07 *** -0.20 ***


(0.01) (0.03)
Nota: los errores estándar se reportan en paréntesis.
*, **, ***: indican significancia al 10, 5 y 1 %, respectivamente.

Fuente: Elaboración propia

El Cuadro 4 presenta los resultados de la estimación para la especificación con gustos homogé-
neos. Estos resultados confirman la pertinencia del uso de z1j para instrumentar el precio. Se
evidencia un importante sesgo en el estimador por MCO al notar que α̂MCO = 0.07 es estadís-
ticamente diferente de su valor poblacional. Por el otro lado, α̂VI = −0.2 es estadísticamente
igual a α.

A continuación, se computan las elasticidades usando los coeficientes estimados por VI. La
expresión analítica de las elasticidades precio de la demanda y precio-cruzadas se obtienen al

8
diferenciar la ecuación (7) del modelo Logit con respecto al precio


   α̂pl Sl , si j 6= l
∂sj (δ, p, x; θ) pl
η̂jl = = (13)
∂pl Sj
−α̂pj (1 − Sj ), si j = l

Debe notarse que las elasticidades no dependen de las características del producto. De acuerdo
con Berry (1994) esta especificación no permite obtener patrones de sustitución realistas. Por
ejemplo, al calcular η̂4,5 , aun con j siendo muy cercano a l, se encuentra que

η̂4,5 = 1.13 · 10−14 < 1.27 · 10−13 = η̂4,10

De hecho, (13) implica que la elasticidad precio-cruzada de la demanda de j con respecto al


precio de l es idéntica a la elasticidad correspondiente de otro bien r con respecto al mismo
precio.

5.2. Caso II: Consumidores heterogéneos

Para la especificación del segundo caso, los resultados se obtienen a partir de la estimación
tanto del modelo el Logit, ignorando la presencia de heterogeneidad, como del modelo de
coeficientes aleatorios. Para el modelo Logit, al igual que en el apartado anterior se emplean
MCO y VI. Por otra parte, los resultados de la estimación del modelo de coeficientes aleatorios
se obtuvieron a partir de l algoritmo de BLP, minimizando (12). Dentro del algoritmo, se tomó
un nivel de tolerancia tal que k ln(Sj ) − ln(Spj )k < 0.001, delimitando los valores de σ entre -1
y 1. Entretanto, α̂BLP y β̂BLP se obtuvieron sólo vía VI. Los instrumentos empleados en ambos
modelos incluyen todas la variables en Γ junto con xj y el vector de unos. Los resultados para
los dos modelos se resumen en el Cuadro 5.

Los resultados del modelo Logit sugieren nuevamente la existencia de un sesgo, en este caso,
tanto en α̂MCO como en β̂MCO ; mientras que por VI, el sesgo sólo se manifiesta estadísticamente
significativo en β̂VI . Claramente, el método de BLP provee un mejor desempeño. Los resultados
sugieren que los estimados para modelo de coeficientes aleatorios son casi idénticos a los valores
poblacionales especificados para α y β.

También vale la pena mencionar que G(σ) alcanza un mínimo local en σ̂GMM = 0.252,
muy cercano al parámetro poblacional. En particular, el mínimo alcanzado corresponde a
G(0.252) = 0.047. En la Figura 1 se verifica lo anterior, donde se computa (12) para 11 valores
de σ ∈ [0.2, 0.3] ubicados de forma equidistante alrededor del valor real.

9
Cuadro 5: Resultados Caso II

Coeficientes
Modelo Logit aleatorios
Variable MCO VI BLP
Constante -15.01 *** -13.60 *** -12.55 ***
(0.34) (0.75) (0.23)

xj 0.14 *** 0.16 *** 0.33 ***


(0.01) (0.01) (0.01)

pj -0.10 ** -0.30 *** -0.19 ***


(0.04) (0.10) (0.03)

σ̂GMM - - 0.25
Nota: los errores estándar se reportan en paréntesis.
*, **, ***: indican significancia al 10, 5 y 1 %, respectivamente.

Fuente: Elaboración propia

Figura 1: Mínimo de la función de criterio

0.058

0.056

0.054
G(σ)

0.052

0.050

0.048

0.200 0.225 0.250 0.275 0.300


σ

Fuente: Elaboración propia

10
Figura 2: Distribución del coeficiente aleatorio

1.5

1.0
Densidad

0.5

0.0

−0.5 0.0 0.5 1.0


βi

Fuente: Elaboración propia

En la Figura 2 se ilustra la distribución del coeficiente aleatorio β̂i = β̂BLP +visim . No sorprende
que la curva de densidad tome una forma acampanada, dado que al especificar visim se adoptó
una distribución Normal Estándar.

A continuación, se computan las elasticidades con base en los estimados del modelo de coefi-
cientes aleatorios. La expresión analítica de las elasticidades precio de la demanda y precio-
cruzadas se obtienen al diferenciar la ecuación (11) con respecto al precio. No obstante, para
el cálculo esta expresión debe aproximarse a través de promedios usando visim

 pl α̂ PN S

 Sj N S i=1 ŝij ŝil , si j 6= l
η̂jl = , (14)
 − pj α̂ PN S ŝ (1 − ŝ ), si j = l

Sj N S i=1 ij ij

donde

exp(δjH + µsim
ij )
ŝij = PJ , con µsim sim
ij = σ̂GMM · (xj vi ).
1 + l=1 exp(δlH + µsim
il )

En este caso las elasticidades sí dependen de las características del producto. Replicando el

11
ejemplo del apartado anterior, al calcular η̂4,5

η̂4,5 = 1.31 · 10−6 > 1.30 · 10−6 = η̂4,10

Adicionalmente, las elasticidades precio-cruzadas de la demanda de los j 6= l bienes con res-


pecto a pl no son necesariamente iguales para todo j. En la Figura 3 se muestran los niveles
de correlación entre el vector de elasticidades precio-cruzadas de la demanda de j, η̂ j. con el
vector de cuotas de mercado observadas S.

Figura 3: Correlaciones entre las elasticidades y las cuotas de mercado

0.4

0.2
^ yS

0.0
Correlación entre ηj.

−0.2

−0.4

−0.6

0 25 50 75 100
Producto j

Fuente: Elaboración propia

El nivel de correlación es relativamente, con |ρ̂j | < 0.4 para todo j 6= 100. Para j = 100 el
nivel de correlación está por debajo de −0.6 lo cual puede estar asociado al alto porcentaje
de mercado que ocupa este producto. No obstante, comparado con el caso del modelo Logit,
donde las elasticidades constituyen una combinación lineal de las cuotas de mercado, esta
aproximación proporciona un menor grado de correlación con esta variable.

12
6. Comentarios finales

En este trabajo se exploran las bondades del método para estimación de modelos de elección
discreta propuesto por BLP. Los resultados respaldan la pertinencia de considerar un modelo
con coeficientes aleatorios por tres razones principales: reduce potenciales sesgos en la esti-
mación, permite relajar el supuesto sobre homogeneidad entre consumidores, y especifica un
patrón de sustitución menos restringido que el del modelo Logit.

Las limitaciones de este método radican en el algoritmo de estimación en el cual persiste un


margen de error. En particular, de la parte asociada al nivel de tolerancia del punto fijo y a
las simulaciones sobre el factor de heterogeneidad depende gran parte de los resultados. Esto
implica la necesidad de suficiente información micro sobre la distribución de la población, en
orden de obtener reducir posibles sesgos de estimación.

7. Referencias bibliográficas

Berry, S., Levinsohn, J. & Pakes, A. (1995), Automobile Prices in Market Equilibrium.
Econometrica, 63(4): 841–890.

Berry, S. (1994), Estimating Discrete-Choice Models of Product Differentiation. RAND


Journal of Economics, 25(2): 242–262.

Nevo, A. (2000), A Practitioner’s Guide to Estimation of Random Coefficients Logit


Models of Demand, Journal of Economics and Management Strategy, 9(4): 513–548.

13

También podría gustarte