本文是 IO 需求估计方法的起点。 文章除了介绍BLP的测量结构和算法外,还强调了重写模型的意义及其与之前的经典模型(Logit和Logit)的比较,强调了BLP引入的随机性。 系数模型如何优于 MNL 和 Logit。 它可以被认为是Berry 1994的一个特例,但它更出名的是因为它给出了数值积分和压缩映射的算法,从而可以应用特定的算法。 BLP 的另一个贡献是它还描述了供给方的特征,并指出联合估计需求和供给通常会产生更高的有效性。
需求方预估
要弄清楚BLP的优点,我们必须解释为什么之前的Logit会出现问题。
罗吉特
在经典的logit模型中,借助第一类极值分布,市场份额可以表示为(在以下所有数学表达式中,我们不单独强调价格,而是将其视为x的一部分) s_{ij} \equiv P\left(j \in \arg \max _{k \in C} u_{ik}\right)=\frac{\exp \left(\{x}_j^{\prime} \beta\right )}{\sum_{k \in C} \exp \left(\{x}_k^{\prime} \beta\right)}
I: Logit 的改进
显然,如何引入替代效应、如何解决价格内生性是最本质的问题。
为了解决IIA的问题(即试图引入某种替代效应),后来的一系列logit文献认为可以假设误差项,即出现了类似于下面的说法,其中g是人为划分的品类,这样的误差项显然是一个消费者i对同一品类不同品牌的$\$是相关的,从而构建了同一品类的替代效应。 \{ij}=\left(1-\\right) \nu_{ig}+\ e_{ij} 估计算法将相应复杂,需要 MLE 和 Loop。 但Logit的问题在于,分类引入了人为干预,当Nest的结构比较复杂时,Nest的顺序会明显影响结果(以汽车为例,先按豪华-经济型分类,然后运动-舒适,反之亦然))。
改进二:
为了解决内生价格问题,Berry 1994首先提出可以加上不可观测质量$\xi$来解决。 在这篇论文中,Berry 指出 $\xi$ 是解决这两个问题的核心假设:
Berry用$\delta$来代替乘积的效用,让我们不再关心如何估计一个$\beta$向量,减少了估计的参数。 Berry 讨论了三种情况,简单的 logit 或 logit 情况,或更一般的函数假设。
在简单logit假设下(即随机项iid服从第一类极值分布)仍然与上面的市场份额类似。 此时,由于有外选,可写为 s_{jt}=\frac{\exp \left( \{jt}\right)}{1+\sum_k \exp \left(\{kt} \right)} 因此,使用所谓的 Berry,我们得到 $\{jt}=\ln s_{jt}-\ln s_{0 t}$。 根据定义, \{jt}=x_{jt} \beta+\xi_{jt} 。 因此,您可以执行 OLS 或在 $JT$ 维度(每种产品和每个市场)上使用面板。 它的logit版本,当只有一层嵌套时(即只需要额外估计$\$),可以认为是固定的$\$,市场份额仍然可以显式求解,然后可以用logit方法做一次估计,然后得到错误,最后搜索$\$。 最后,如果 $\$ 的分布是任意形式,则求解市场份额 (3) 将缺乏显式解,并且可能需要数值积分。 该解决方案的目的是获得 $\delta$ 的估计,然后使用 GMM 来估计 $\beta$ (使用类似 $\ E[\left(\delta-x_t^{\prime} \beta\right )| z_t]=0$ 时刻条件)。
值得注意的是,Berry 1994 并没有对情况(3)给出明确的解决方案,而直接使用 Logit 的情况(2)可以理解为 Nest 的思想和不可观察质量的结合,只不过(2)使用了 ad -hoc分类模型(因此继承了Logit的所有缺点,例如依赖Nest order),而(3)直接假设随机项满足任意分布(因此自然允许不同产品之间存在相关性,也自然包括(2),但因为太笼统,相当于估计$J$产品的随机项的相关系数矩阵,参数数量太多)。
1995年BLP
随机系数要求是一系列尝试使用Logit思想来解决IIA的模型。 本质是用更容易理解的方式引入随机项之间的相关性(而不是在Berry 1994(3)ad hoc相关系数矩阵的情况下使用待估计值)。 BLP本质上是Berry 1994的一个特例。虽然它看起来不像它最初的形式,但这就是我认为它包装得很好的地方。 它假设效用函数是柯布-道格拉斯型,这使得 $x_{jt}\$ 中包括收入和价格的项可能是 $\ln(y_i-p_{jt})$ 而不是线性项,但这并不意味着Not core,Nevo使用拟线性效用函数来获得线性$y_i-p_{jt}$项。 该术语不影响计算的性质,适用于不同的研究产品。 例如,线性类型表示没有财富效应。 它可能适合较便宜的产品(例如 Nevo 研究的即食谷物),而对数类型可能更适合较昂贵的产品(例如 BLP 研究的汽车) \begin{} u_{ijt} & =x_{jt} \+\xi_{jt}+\{ijt} \\ u_{i 0 t} & =\{i 0 t} \\ \ & =\beta+\ v_k \\ \left(\{i 0 t}, \ ldots, \{i J t}\right) & \sim \text { iid } \{EV}\\ v_k & \sim \text { iid }\{N(0,1)} \end {} 可以变换写为 \begin{} u_{ijt} & =x_{jt} \beta+\xi_{jt}+\mu_{ijt} \\ u_{i 0 t} & =\mu_{i 0 t } \\ \left (\mu_{i 0 t}, \ldots, \mu_{i J t}\right) & \sim \text{Some } \end{} 其中 $\mu$ 被视为新的随机数项,那么该项不是独立同分布的,可以认为是 Berry 94 的特殊分布。我们可以计算它的相关系数, \begin{} \{corr}\left(\mu_{ij}, \mu_{il }\right) & =\frac{\sum\ \^2 x_{jk} x_{lk}}{\sqrt{\left(\sum\ \^2 x_{jk}^2+\^2\right) \cdot\left( \sum\ \^2 x_{lk}^2+\^2\right)}} \\ \{corr}\left(\mu_{ij}, \mu_{i 0}\right) & =\frac{ \^2}{\sum\ \^2 x_{jk}^2+\^2}, \end{} 这样的相关系数的特点是,当产品 j 和产品的产品特征k 很接近,corr 相对较大,这体现了替代效应。
在这里我们实际上可以揭示BLP模型最大的改进:它给出了一个更容易理解的故事,并且允许使用更少的参数来表征不同产品的随机项之间的相关性。 具体来说,BLP假设每个消费者对产品的每一个指标都有不同的品味(注意是针对指标k而不是产品。例如,如果他看重汽车的马力,那么他看重的是汽车的马力)所有品牌汽车的马力,所以自然肌肉跑车之间的替代效应会更强),并且口味满足随机分布。 每个性能指标k与均值$v_{ik}$、iid有偏差,其方差为$\^2$。 事实上,这也大大减少了需要估计的参数数量。 我们只需要估计味道向量$\beta$所在的分布的均值,以及$\$(总共$K$),而不再需要估计$\frac{J(J-1) }{2}$ 用参数表征的相关矩阵。 因此,式(5)到式(6)的变化可以认为是BLP模型假设的核心。 在此假设下,应用 Berry 1994 的算法,对 $s_{jt}$ 的表达式进行数值积分,我们有\begin{} s_{jt} &=\sum\{i=1}^{ns}\ frac{ \bar s}{\bar f(v_i,\theta)} f_j(v_i,\theta) =C_1 \sum_{除 v} \frac{\exp (\{jt}+\mu_{jt}) }{1 +\sum (\{jt}+\mu_{jt})} 。 \end{} 原文中推荐的划分 v 的方法是采样,然后根据密度概率接受或拒绝,使用如下迭代 T (s, θ, P)\left[\\right]=\+ \ln \left(s_j\right)-\ln \left[s_j(p, x, \, P ; \theta)\right] 更新 $\delta$ 的解。 证明T是一个压缩图(模小于1),这保证了使用式(11)更新的序列一定收敛。 因此,需求函数的计算可以用以下单纯形算法来表征:
猜测$\sigma$得到这个$\sigma$下的估计值$\delta$ 猜测$\$重复更新$\=T^i(\)$直到收敛 使用$\delta$做GMM估计$\beta $ \ min (\delta-x\beta)' z
BLP本身知道两层搜索是一个非常复杂的计算行为,所以它给出了一些实用的技巧,比如尽量让初始值更加准确。 一种方法是自己悄悄做一个Logit,将估计结果作为$\$。 另外,BLP的无偏性还需要非常严格的条件来保证,这将在误差分析部分再次提到。 作为BLP的改进,这部分算法被替换为(MPEC算法)。 该算法的核心思想是将上述问题转化为约束最小化问题,即\begin{array}{rl} \min _{\delta, \bar{\beta}, \} & g( \delta ; \bar{\beta})^{\prime} W g(\delta ; \bar{\beta}) \\ \text { st } & s_j= \int \frac{\exp \left(\+ \sum_k x_{jk} \nu_{ik} \\右)}{1+\sum_q \exp \left(\+\sum_k x_{qk} \nu_{ik } \\右)} d F_\nu\left (\nu_i\right) \quad \text { 对于所有 } j 。 \end{array} 该算法没有利用$\delta$的唯一性,但直接用\delta$进行搜索可能会导致搜索空间过大。 但MPEC通常被认为是比BLP更有意义的实用算法。
结合供应方的估计
供给方的描述是标准的纳什,即制造商调整自己生产的所有产品的价格,以实现利润最大化。 得到的矩阵表达式为 $p=mc+\Delta^{-1} (p) s(p)$
其中mc表示边际成本,用可见变量$w$和不可见变量$\omega$来表征:$\log \left(m c_j\right)=w_j \gamma+\$
因此,我们有 \=\log \left(p_j-e_j^{\prime} \Delta(p)^{-1} s(p)\right)-w_j \gamma 如果我们假设 IV 足够好,那么也就是说,它与shock $\$和shock $\omega$正交,那么它们可以联合估计,即在GMM中多增加一维:g(\delta; \bar{\beta}, \gamma )=\frac{1}{J}\ left(\begin{array}{c} \sum_j\left(\-\{x}_j^{\prime} \bar{\beta}\right) h\left (z_j\right) \\ \sum_j\left (\log \left(p_j-e_j^{\prime} \Delta(p)^{-1} s(p)\right)-w_j \gamma\right) h \left(z_j\right) \end{数组}\right)
误差分析
在 Berry 和 Pakes 的另一篇论文中,给出了 $\delta$ 统计量的渐近性质。 一致性要求采样次数ns和消费者样本数n都必须足够大。 随着产品J数量的增加,越来越多的产品的选择概率趋于0。因此,J的大小实际上决定了n和ns增长率的下界。 这部分看似容易被忽视,但也是其缺点的主要来源。 BLP利用BP方法将协方差矩阵分解为三部分
第二部分误差的内涵是,两层搜索的精度必须足够好,才能保证BLP估计器的无偏性。 例如,传统对$\delta$估计的要求通常是1e-13或者更准确,对于$\sigma$的估计精度可以稍微放宽。 对数据的要求也比较高,要求消费者数量、采样次数和市场数量以足够大的速度增长以适应产品数量。 事实上,几乎没有人读过 BLP 自己论文的实证部分(而且很多人说这根本就是错误的)。 原因之一应该是市场数量相对于产品数量来说太少了(20年总共观察了2217个,并且有900多个产品)。 另外,其每个产品的市场份额对于外部选择来说太小(其$s_0$每年都在0.8以上),这自然导致$\delta$本身很难准确估计,更不用说使用估计的$\ delta$ 来估计 $\beta$。
尼沃,阿维夫。 “A 的 of 的指南 - logit of ”。 & 9.4 (2000): 513-548。
邢莉. '注释3:Logit'
邢莉. '注释4:级模型'
贝里、詹姆斯和阿里尔·帕克斯。 “在。” 63,没有。 4(1995):841-90。
贝瑞,. ”,”兰德公司,25, 242-262。
弗兰克.《笔记》
M.岑. ' 注:- '
齐吾. '注释:IO'
/p/
另外,我在(kohei-..io)找到了一个非常好看的IO课件
还有一个兄弟BLP的BLP——伊万·李()