总离差平方和(TSS)
总离差平方和是衡量因变量实际值与其均值之间差异的一个指标。它反映了所有观测值围绕其平均值波动的整体程度。公式可以表示为:
\[ \text{TSS} = \sum (y_i - \bar{y})^2 \]
其中 \( y_i \) 是第 i 个观测值,\( \bar{y} \) 是因变量的平均值。
回归平方和(ESS)
回归平方和表示的是由自变量解释的部分,即通过回归方程预测得到的因变量值与因变量均值之间的差异。它可以用来评估模型能够解释多少因变量的变化。其计算公式如下:
\[ \text{ESS} = \sum (\hat{y}_i - \bar{y})^2 \]
这里 \( \hat{y}_i \) 是通过回归模型预测出的第 i 个观测值。
残差平方和(RSS)
残差平方和则描述了那些未被模型捕捉到的部分,也就是实际观测值与预测值之间的误差平方和。它是衡量模型预测准确性的重要指标之一。RSS可以通过以下公式计算得出:
\[ \text{RSS} = \sum (y_i - \hat{y}_i)^2 \]
这三个组成部分之间存在这样一个关系:\[ \text{TSS} = \text{ESS} + \text{RSS} \]
这意味着,因变量的变化可以分为两部分:一部分是由自变量解释的(ESS),另一部分则是无法解释的随机误差(RSS)。
通过对这三者的研究,我们可以更好地了解所建立回归模型的有效性和适用性。例如,如果ESS占比较大,则表明该模型具有较强的解释力;而RSS较小,则意味着模型对于数据点的拟合效果较好。因此,在进行回归分析时,合理地利用这些指标来调整和优化模型是非常必要的。


