主页 > X生活禅 >从数学建模观点看最「适配」直线(一) >

从数学建模观点看最「适配」直线(一)

2020-06-17

二千年前,天文学家托勒密 (Ptolemy, c.90-c.168) 的地心说,以地球为中心建立了太阳依圆形轨道绕地球运转的天体运动模型,更一般性地,他在《天文学大成》(Almagest)一书中阐述了天体的运动轨迹为大圆的数学模型。

到了十六世纪天文学家哥白尼 (Copernicus, 1473-1543) 则改成以太阳为中心,地以圆形轨道绕日运行,大大简化了模型的複杂度(将托勒密理论中的均轮和周转圆,从原本的77个化减化34个)。

再到十七世纪克卜勒 (Kepler, 1571-1630) 除了接受哥白尼的日心说之外,依据其老师弟谷 (Tycho Brahe, 1546-1601) 的大量观测数据,进一步建立了地球以椭圆形轨道绕太阳运行的天体运动定律,而这样的数学模型更为「简洁」而且「漂亮」。上述大家耳熟能详的例子,都是现实生活与天文学研究中的数学建模实例。

另一方面,在高中课程里,我们常会碰到下述问题:
坐标平面上给定两点,求通过此两点之直线方程式(一次函数图形);给定三点求通过此三点之抛物线方程式(二次函数图形)或圆之方程式等。一般而言,已知坐标平面上 \(n+1\) 个点 \(P_1\)、\(P_2\)、\(\cdots\)、\(P_n\)、\(P_{n+1}\),恰可造一个次数不高于 \(n\) 次的多项式函数 \(f(x)\),使其通过这 \(n+1\) 个点。

这样的问题与数学建模息息相关,例如当我们在 \(t_1\)、\(t_2\)、\(\cdots\)、\(t_{n+1}\) 等 \(n+1\) 个时间点,观测、收集了 \((t_1,x_1)\)、\((t_2,x_2)\)、\(\cdots(t_{n+1},x_{n+1})\) 等 \(n+1\) 笔数据时,可利用这些数据造一个 \(n\) 次函数,使其图形通过这 \(n+1\) 个点,此时当我们可据此函数推估、预测当 \(t=t_{n+1}\) 时 \(x_{n+1}\) 的值。上述 \(n\) 次多项式函数,可透过多种方式求得,例如待定係数法或者牛顿插值多项式又或者拉格朗日插值多项式等。再利用多项式相等的判别定理,便可确保此 \(n\) 次多项式函数的存在唯一性。

虽然,上述 \(n\) 次多项式函数的数学模型可完美地通过 \(n+1\) 笔数据资料,但统计家偏好较简单的模型,希望以较简单却又负载足够资讯量与解释量的模型来描述这些数据。

图一中所示,为 \(20\) 笔数据所形现之散布图,虽然我们可造一个 \(19\) 次多项函数,使其图形通过这 \(20\) 点,作为一个「完美」的数学模型,然而,\(19\) 次多项函数的图形过于「複杂」,因此,统计学家试图透过其它方式为这笔数据建立一个适当的模型。

从数学建模观点看最「适配」直线(一)

图一 某20笔观察数据之散布图

从上述散布图可看出这 \(20\) 笔二维数据具有高度的直线相关性,当横坐标上的变数 \(x\) 增大时,纵坐标上的变数 \(y\) 也有线性增大的趋势,又或者可进一步计算这些数据的(直线)相关係数 \(r\),发现其介于 \(0.7\sim 1\)之间,具有高度的直线相关性。

在此条件下,不难想像我们可以为这笔数建立一个较简单的「直线」模型。换句话说,从建模的角度来看,统计学家希望找到一条理论上的直线,最能「适配」(fit)这 \(20\) 笔数据。若以台语里的「速配」来看,这里统计上的译名相当贴切、别具味道。建立此直线模型后,可利用此模型进一步进行预测与解释。例如在给定自变数 \(x\) 值的条件下预测应变数 \(y\) 的值,或者说明某中某一变数解释另一变数的程度。

当然,此直线并不会通过上述所有的 \(20\) 笔资料,甚至此直线有可能完全不 通过散布图中的任一个点(参见图二中的20笔观察数据与其适配直线)。因此,统计学家势必透过某些方式或限制来探求这条理想中的直线。至于求此直线的想法,留待〈从数学建模观点看最「适配」直线(二)」介绍。

从数学建模观点看最「适配」直线(一)

图二 前述20笔观察数据之散布图与适配直线

连结:从数学建模观点看最「适配」直线(二) 


上一篇: 下一篇:

相关推荐