目的

  1. 当我们在回归模型中想了解百分比关系的时候,经常用log来转换变量。

原理

  1. Logarithms用作nonlinear regression function,将变量的变化转换成百分比形式,许多关系更适合通过百分比来表示。

    log与百分比之间的关系依赖于下列公式:

    \(ln(x + \Delta x) - ln(x) \approx \frac {\Delta x}{x}\) (when \(\frac {\Delta x}{x}\) is small)

    此时,ln(x)的系数则可以对应做百分比的系数。

  2. 将指数运算化为线性运算。

  3. 经济时间序列数据经常在取数值或取对数值的差分之后进行分析,这样做的一个原因是许多经济时间序列呈现近似指数增长的态势,即平均而言,长期中的序列增长率每年保持在一个固定的百分比。这一点意味着,序列的对数值近似线性增长。这样做的另一个原因是,许多经济时间序列变量的标准差大约与它的水平值成正比。这也意味着,序列对数值的标准差近似于一个常数。无论是哪一种情况,将时间序列数据转化成对数形式都是有用的,因为对数值的变化相当于原始序列的百分比变化。

  • 注意:

    • log只用于正数。

    • 当因变量不同时,不能依靠\(R^2\)选择模型 (例如一个因变量是Y, 另一个是\(ln(Y)\))。此时,可以依靠经济学理论或者专家知识来选择模型。

    • 当因变量ln(Y)转换回Y时,Y的估计是有偏的。因为即使\(E(u_i \mid X_i)=0\), \(E(e^{U_i} \mid X_i) \ne 1\)。

参考

  1. Wikipedia: Logarithmic scale
  2. Stock J H, Watson M W. Introduction to econometrics (3rd Edition)[M]. 2015. Section 8.2 Nonlinear Functions of a Single Independent Variable.