Смещение при эндогенности из-за пропущенной переменной

При воспроизведении ссылка на сайт автора обязательна.

Рассмотрим структурную («длинную») модель: \begin{equation}\label{eq:str} \text{wage} = \alpha_0 + \beta_0 \text{educ} + \gamma_0 \text{IQ} + U, \quad E(U \mid \text{educ}, \text{IQ}) = 0, \end{equation} где переменные \(\text{educ}\) и \(\text{IQ}\) предполагаются экзогенными. Тем не менее, мы не наблюдаем IQ, так как не смогли собрать эти данные.

Оценивается «короткая» модель:

\[ \text{wage} = \alpha_1 + \beta_1 \text{educ} + V,\]

где ошибка \(V\) получается составной из-за того, что в неё входит всё то, что не включено в модель: \(V = \gamma_0 \text{IQ} + U\).

Построим наилучший линейный прогноз (best linear predictor, BLP) обеих частей стуруктурного уравнения от переменной \(\text{educ}\):

\[ \text{BLP}(\text{wage} \mid \text{educ}) = \alpha_0 + \beta_0 \text{educ} + \gamma_0 \text{BLP}(\text{IQ} \mid \text{educ}).\]

Известно, что для двух любых случайных величин \(A\) и \(B\) наилучший линейный прогноз выражается следующим образом:

\[ \text{BLP}(A\mid B) = \delta_0 + \delta_1 B,\]

где

\[ \delta_1 := \frac{\text{Cov}(A,B)}{\text{Var}(B)}, \quad \delta_0 := \mathbb{E}A - \delta_1 \mathbb{E}B.\]

Тогда \(\text{BLP}(\text{IQ} \mid \text{educ}) = \delta_0 + \delta_1 \text{educ}\), где \(\delta_1 := \frac{\text{Cov}(\text{IQ}, \text{educ})}{\text{Var}(\text{educ})}\) и \( \delta_0 := \mathbb{E}(\text{IQ}) - \delta_1 \mathbb{E} (\text{educ})\).

Значит,

\[ \text{BLP}(\text{wage} \mid \text{educ}) = \alpha_0 + \beta_0 \text{educ} + \gamma_0 (\delta_0 + \delta_1 \text{educ}) = (\alpha_0 + \gamma_0 \delta_0) + (\beta_0 + \gamma_0 \delta_1) \text{educ}.\]

Следовательно, существует точное соответствие между коэффициентами истинной структурной модели и короткой модели с пропущенной переменной:

\[ \alpha_1 = \alpha_0 + \gamma_0 \delta_0 \quad \text{и} \quad \beta_1 = \beta_0 + \gamma_0 \delta_1.\]

Если будет оценена короткая модель, то вместо истинного эффекта образования \(\beta_0\) получится \(\beta_0 + \gamma_0 \delta_1\), то есть величина смещения будет \(\gamma_0 \delta_1\). Это смещение поддаётся интерпретации: \(\gamma_0\) — истинный каузальный эффект IQ на wage (коэффициент при пропущенной переменной в структурном уравнении), \(\delta_1\) — коэффициент при \(\text{educ}\) в линейной проекции \(\text{IQ}\) на \(\text{educ}\).

Если эффект пропущенного IQ положительный, \(\gamma_0 > 0\), и корреляция наблюдаемой включённой и ненаблюдаемой пропущенной переменной положительная, \(\text{Cov}(\text{educ}, \text{IQ}) > 0\), то \(\gamma_0 \delta_1 > 0\), т. е. имеет место смещение вверх и эффект образования переоценён.

Заметим, что данный теоретический вывод никак не зависит от выборки, которая будет впоследствии использована для оценивания модели. Смещение, равное \(\gamma_0 \delta_1\), не исчезает при увеличении числа наблюдений, поэтому МНК-оценка данной модели смещённая и несостоятельная. Для получения состоятельной оценки нужно использовать GMM (или его популярный частный случай — двухшаговый МНК, 2МНК, 2SLS, TSLS) и дополнительные переменные (исключённые инструменты), которые при выполнении некоторых свойств (валидность и релевантность) способны дать состоятельную оценку параметра \(\beta_0\), но это тема для другого раза.