上QQ阅读APP看书,第一时间看更新
第5章 多元线性回归
在第3章我们介绍了简单线性回归,并以教育和收入之间的关系为例对其应用加以说明。然而,在实际研究中,仅含有一个自变量的模型往往不能对我们所研究的问题给出恰当的描述,因为任何一个社会现象总是同时受到多个因素的影响。譬如,在第3章的例子中,除了教育之外,性别、工作年限、党员身份、地区等因素都会对个人收入产生影响。如果我们仅考虑个别因素(比如,教育)对结果变量(比如,收入)的影响,而忽略了其他有关变量的影响,则回归模型的参数估计可能是有偏的,或至少是不够精确的。换句话说,在社会研究中,由于许多变量之间都存在一定程度的相关,所以一元回归分析无法确定某一自变量对结果变量的净效应或者偏效应。而偏效应对于社会研究而言是非常重要的,因为它表达了某个因素对结果变量的独立贡献。因此,本章将介绍包含多个自变量的多元回归模型(multiple regression model)。我们将利用第4章介绍的线性代数知识来进行讨论,这将大大简化有关的推导过程。