整体说明
- 拟合优度(Goodness of Fit)是指所建立的模型对实际观测值的拟合程度
- 在回归分析中,它衡量了自变量对因变量的解释程度,拟合优度越大,说明拟合越好
- 拟合越好,意味着:自变量引起的变异占总变异的百分比越高,观察点在回归直线附近越密集
拟合优度的度量:决定系数 \(R^{2}\)
- 度量拟合优度的常用统计量是决定系数(coefficient of determination) ,一般记作 \(R^{2}\)
- \(R^{2}\) 的计算公式为:
$$R^{2}=\frac{SSR}{SST}=1 - \frac{SSE}{SST}$$- \(SSR\) 为回归平方和
- \(SSE\) 为残差平方和
- \(SST\) 为总离差平方和
- 注:\(SST = SSR + SSE\)
- 若用 \(y_{i}\) 表示真实的观测值, \(\bar{y}\) 表示真实观测值的平均值, \(\hat{y}_{i}\) 表示拟合值,则 \(SSR\) 、 \(SSE\) 、 \(SST\) 的具体计算公式如下:
- 总平方和 \(SST=\sum_{i = 1}^{n}(y_{i}-\bar{y})^{2}\)
- 回归平方和 \(SSR=\sum_{i = 1}^{n}(\hat{y}_{i}-\bar{y})^{2}\)
- 残差平方和 \(SSE=\sum_{i = 1}^{n}(y_{i}-\hat{y}_{i})^{2}\)