主页 > Y轻生活 >从数学建模观点看最「适配」直线(二) >

从数学建模观点看最「适配」直线(二)

2020-06-17

连结:从数学建模观点看最「适配」直线(一) 

当我们观察某组二维数据之散布图后,若发现这两变数间呈现出正比趋势,或具高度的直线相关时,自然会联想到利用直线 \(y=\beta_0+\beta_1x\) 模型来适配这组二维数据。

假设这条理想的直线为 \(y=\beta_0+\beta_1x\),数学上一般会利用最小平方法(least squares method)来探求此理想直线的参数 \(\beta_0\) 与 \(\beta_1\)。统计学里,将每一笔资料 \((x_i,y_i)\) 的观察值 \(y_i\) 与此直线的垂直差距称为「残差(residual)」,当然残差平方越小,表示该笔资料与最佳直线的垂直距离也越小,即越接近该直线。

因此,直观上我们不难想像,当一条直线能使得所有资料的残差平方和越小,则此直线越「适配」这组资料,亦即适配度越佳(goodness of fit)。而所谓的最小平方法,本质上即是使得所有残差之平方和最小时,所得之直线,此直线即为一般所谓的迴归直线、最小平方直线或也被称为最适配直线、最佳直线等。例如图一当中的红色直线即为这些数据的最适配直线,而蓝色线段所示即当中某些资料 \(y_i\)的残差。 

至于如何实际推导、证明、求得此直线的过程或相关廻归直线公式,读者可参考一般高中教科书或大学统计教本,在此不赘述。统计上,估计参数,除了最小平方法之外,也有统计学家利用动差法(Method of Moment)或最大概似估计法(Maximum likelihood estimation)来求相关参数,不过相关概念涉及大学统计,在此亦不多讨论,这里仅提醒读者最小平方法并非估计统计参数的唯一方法。

从数学建模观点看最「适配」直线(二)

图一 某20笔观察数据与其最适配直线

若从数学建模的观点来看,依上述最小平方法实际求得了最适配直线 \(y=\beta_0+\beta_1x\) 之后,便相当于为这笔数据建立了一个数学模型。一般而言,当 \(X\) 与 \(Y\) 两变数具高度直线相关性时,此直线与这些数据之间的「适配度」良好,这除了表示此直线对于这些资料而言,具代表性之外,我们也可以透过此直线进一步预测与推估,例如当 \(x\) 为某定值时,可利用此直线预测可能的 \(y\) 值。当然,实际观测所得的 \(y\) 值未必等于最适直线上的 \(y\) 值,会因环境、实验误差、量测误差等因素造成误差的存在。

再者,此直线的斜率 \(\beta_1\) 说明了在变数 \(X\) 变动之下,变数 \(Y\) 相对应的变动程度,即当 \(X\) 变动 \(1\) 单位时,变数 \(Y\) 相对应的变动量。而此直线的截距 \(\beta_0\) 通常较不具重要意义,例如就体重(\(Y\))对身高(\(X\))的迴归直线来看,\(\beta_0\) 可看成身高为 \(0\) 的人其体重的预测值,但此值显然不具重要意义。

另一方面,如图二与图三所示为另外 \(30\) 笔观察数据之散布图,从图二散布图来看,不难发现其(直线)相关性不高,或从其相关係数之值接近 \(0\) 来看,可谓低度(直线)相关。这时,若贸然求其最适配「直线」事实上意义并不大,「适配度」不高且解释与预测上皆有失偏颇。从这些散布图来看,不难发现图三当中 \(X\) 与 \(Y\) 两变量之间呈现出二次函数的趋势,这时,适配图二这 \(30\) 笔数据之数学模型不再是简单线性模型,而应为二次曲线 \(y=\beta_0+\beta_1x+\beta_2x^2\)。

从数学建模观点看最「适配」直线(二)

图二 某30笔观察数据之散布图一

从数学建模观点看最「适配」直线(二)

图三 某30笔观察数据之散布图二

再就图三中的 \(30\) 笔资料的散布图来看,其直线相关性尚可,相关係数中等,但就此散布图来看,不难发现 \(X\) 与 \(Y\) 两变量之间呈现出指数函数的趋势。因此,若要适配图三这 \(30\) 笔数据,则指数模型会比直线模型来得适当才是。


参考文献

高中数学教科书第二册


上一篇: 下一篇:

相关推荐