下图显示了10 个数据点的散点图和拟合曲线。
蓝点代表原始数据。为红点为拟合曲线给出的预测值。从预测值到数据点的垂直箭头代表残差。向上箭头对应于正残差,向下箭头对应于负残差。
在残差图中,每个值大于零的点对应于原始数据集中观测值大于预测值的数据点。类似地,负值对应于观测值小于预测值的数据点。 我们使用残差图来确定拟合函数的形式(模型)是否与数据分布一致。
下图的数据,采用线性模型进行拟合。观察残差图可以发现,残差点是随机分散的。当我们从左到右检查残差时,沿x轴的方向残差的分散没有以任何系统的方式变宽或变窄。我们没有看到特定的模式。这说明了数据符合模型(即数据分布满足线性模型)。
例1.
残差的绝对值从左向右移动而稳步增大。换句话说,当我们从左向右移动时,观测值与预测值的偏差越来越大。
残差图中的模式表明单一的模型不能很好的描述数据。
例2.