【Method】Logarithmic scale
目的
- 当我们在回归模型中想了解百分比关系的时候,经常用log来转换变量。
原理
-
Logarithms用作nonlinear regression function,将变量的变化转换成百分比形式,许多关系更适合通过百分比来表示。
log与百分比之间的关系依赖于下列公式:
\(ln(x + \Delta x) - ln(x) \approx \frac {\Delta x}{x}\) (when \(\frac {\Delta x}{x}\) is small)
此时,ln(x)的系数则可以对应做百分比的系数。
-
将指数运算化为线性运算。
-
经济时间序列数据经常在取数值或取对数值的差分之后进行分析,这样做的一个原因是许多经济时间序列呈现近似指数增长的态势,即平均而言,长期中的序列增长率每年保持在一个固定的百分比。这一点意味着,序列的对数值近似线性增长。这样做的另一个原因是,许多经济时间序列变量的标准差大约与它的水平值成正比。这也意味着,序列对数值的标准差近似于一个常数。无论是哪一种情况,将时间序列数据转化成对数形式都是有用的,因为对数值的变化相当于原始序列的百分比变化。
-
注意:
-
log只用于正数。
-
当因变量不同时,不能依靠\(R^2\)选择模型 (例如一个因变量是Y, 另一个是\(ln(Y)\))。此时,可以依靠经济学理论或者专家知识来选择模型。
-
当因变量ln(Y)转换回Y时,Y的估计是有偏的。因为即使\(E(u_i \mid X_i)=0\), \(E(e^{U_i} \mid X_i) \ne 1\)。
-
参考
- Wikipedia: Logarithmic scale
- Stock J H, Watson M W. Introduction to econometrics (3rd Edition)[M]. 2015. Section 8.2 Nonlinear Functions of a Single Independent Variable.