求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

共线性查看源代码讨论查看历史

跳转至: 导航搜索

来自 孔夫子旧书网 的图片

共线性是全国科学技术名词审定委员会审定、公布的科技类名词。

关于中国文字的起源[1]主要有两种观点:起源于刻画符号和“图画文字”起源说[2]。我们现在已知的最早的文字是安阳殷墟出土的甲骨文

名词解释

共线性,即同线性或同线型。统计学中,共线性即多重共线性。

多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。

产生原因

主要有3个方面:

(1)经济变量相关的共同趋势。

(2)滞后变量的引入。

(3)样本资料的限制。

影响

(1)完全共线性下参数估计量不存在。

(2)近似共线性下OLS估计量非有效。

多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF)如果方差膨胀因子值越大,说明共线性越强。相反 因为,容许度是方差膨胀因子的倒数,所以,容许度越小,共线性越强。可以这样记忆:容许度代表容许,也就是许可,如果,值越小,代表在数值上越不容许,就是越小,越不要。而共线性是一个负面指标,在分析中都是不希望它出现,将共线性和容许度联系在一起,容许度越小,越不要,实际情况越不好,共线性这个“坏蛋”越强。进一步,方差膨胀因子因为是容许度倒数,所以反过来。总之就是找容易记忆的方法。

(3)参数估计量经济含义不合理。

(4)变量的显著性检验失去意义,可能将重要的解释变量排除在模型之外。

(5)模型的预测功能失效。变大的方差容易使区间预测的“区间”变大,使预测失去意义。

需要注意:即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。但是OLS法在统计推断上无法给出真正有用的信息。

参考文献