在许多实际问题中, 有时变量之间的关系不是简单的线性相关关系,而是某种非线性相关关系。当它们之间的关系是非线性时,如果仍进行线性回归,那么此时回归方程就没有意义.所以必须进行非线性回归. 那么假设两个变量之间具有什么关系呢?其实,最简便的方法是用两个变量的n组独立观测值(xi,yi) (i=1,2,\",n)在平面坐标系里描点,根据这n个点的形状,与常见的函数图形做比较,选择一条曲线拟合这n个点.这样就可以给出两个变量之间的关系. 然而对于一般的非线性回归, 直接求非线性回归方程仍然是比较难的, 感兴趣的读者可以参考非线性回归的一些专著.不过对于一些特殊情况,可以通过变量代换化为线性回归问题来处理. 在化为线性回归方程以后, 就可以按照最小二乘法估计其参数, 从而给出原曲线方程中参数的估计.下面通过一个例子来具体说明处理这种问题的方法.
例 炼钢时所使用的钢包, 由于受到钢液及炉渣的影响, 钢包的容积随着试验次数的增加会不断增大, 根据表6.6的数据, 我们来找出试验次数x与钢包容积y的关
2
系.
表6.6
x
y
x
y
2 106.423 108.204 108.985 109.507 110.008 110.1310 110.49
11 110.5914 110.6015 110.9016 110.7618 111.0019 111.02
解 在坐标轴上画出散点图, 如图6.2所示, 从图上我们可以看出, 随着试验次数x的增大, 钢包容积y开始增加速度较快,然后逐渐减慢, 而点的分布越来越接近于一条平行于x轴的直线, 因此钢包的容积不会无限增大. 显然将该曲线看作线性回归的模型是不合适的.
根据散点图的变化趋势以及函数图象的知识,我们设想试验次数x与钢包容积y具有双曲线的关系.
3
图6.2 试验次数x与钢包容积y之间的关系曲线 设双曲线方程为
b1
=a+ yx
其中a,b为待定常数, 若令 y′=, x′= 则双曲线方程可以改写为线性方程 y′=a+bx′ 于是,将表
6.6
中的数据相应地变为
1
y1x
′,y1′),(x′′′′(x12,y2),\",(x13,y13).
这样就可以应用求线性回归方程的方法得到待定常数a,b的估计值.
ˆ=0.0008462 ˆ=0.008968,ba
进而可以得到回归方程为
11
=0.008968+0.0008462 ˆyx
4
ˆ=或写为 y
x
0.008968x+0.0008462
通过上述例子可以看出, 解决非线性回归的关键是根据x,y的观测值画出散点图, 然后选择合适的曲线, 最后通过变量代换把非线性回归化成线性回归, 即采用非线性回归线性化的方法.如何选择曲线的类型, 除了根据散点图的特征外, 在实际应用中,还需要根据专业知识和经验来确定.下面简单介绍六种常见的非线性回归模型以及所采用的线性化方法.
(1)双曲线=a+型, 如图6.3所示. 令u=,v=, 则得u=a+bv.
(2)指数曲线y=cebx型, 如图6.4所示. 令u=lny,v=x,a=lnc,则 u=a+bv. (3)指数曲线y=ceb/x型, 如图6.5所示. 令u=lny,v=,a=lnc,则得u=a+bv. (4)幂函数y=cxb型, 如图6.6所示. 令u=lny,v=lnx,a=lnc,则得u=a+bv. (5)对数曲线y=a+blnx型, 如图6.7所示. 令u=y,v=lnx,则得u=a+bv.
1x
1y
1x1y
bx
5
(6)S曲线y=
1y
1
型,如图6.8所示. a+be−x
令u=,v=e−x,则得u=a+bv.
因篇幅问题不能全部显示,请点此查看更多更全内容