3.2 一元线性回归
实施市场预测时,若仅考虑一个影响预测目标的因素,且其与预测目标之间的因果关系为线性关系时,则可用一元线性回归模型进行预测。一元线性回归预测法的数学模型为:
=a+bx
式中, x―― 影响因素,是自变量;
――
预测值,是因变量;
a,b―― 两个待定常数, b 又称为回归系数。
1.参数确定
运行最小二乘法进行 a 和 b 这两个常数的确定,求解公式为:

在进行参数确定时,可先进行变值中心化处理,从而简化计算。 所谓变值中心化,就是将各数值减去其相应的平均值。
例2-6
,据统计,某地区 1997 ~ 2002 年家电产品销售额和该地区职工的工资总额的统计数字如表 2
- 7 所示。试建立它们之间的一元线性回归模型。
表2-9 某地区1995~2002年家电产品销售额和该地区职工的工资总额的统计数字
年份
|
1995
|
1996
|
1997
|
1998
|
1999
|
2000
|
2001
|
2002
|
家电销售额Y
(亿元) |
3 |
5 |
6 |
7 |
8 |
8 |
9 |
10 |
工资总额X
(亿元) |
18 |
25 |
30 |
39 |
41 |
42 |
49 |
52 |
解: ,从而可令:
:-
19 ,- 12 ,- 7 , 2 , 4 , 5 , 12 , 15 ,
:-
4 ,- 2 , - 1 , 0 , 1 , 1 , 2 , 3 ,
则有 ,
,
,可以求得:
。
所以,该地区家电销售额和工资总额的模型为:Y=-0.03+0.19X
。
2.模型检验
通过参数确定,很容易得到变量间关系的回归模型,但模型是否与实际数据有很好的拟合度,能否进行预测,数据是否与其它因素有关?因此要进行模型的检验。常用方法有经济意义检验、
t 检验和相关系数检验。
(1)经济意义检验
模型中的参数符号有其特定的经济含义,通过实际经济现象就可以看出模型是否与实际相符。如例 2 - 6
中,家电销售应与工资总额同向变动,即 b 应大于0 ;又由 a =- 0.03
可知,当工资总额降到一定程度后,家电销售额为零,这与实际也是相符的,从而通过了经济意义检验。
(2)t
检验
回归模型是一种统计模型,是从观测数据中得到的。 t 检验就是用 t 统计量对回归系
数 b 进行检验,其目的是检验变量 x 与变量 y 之 间是否确实有关系,
x 是否影响 y 。 t 统计量的计算公式如下:
。
其中 ,
b 为确定出的回归系数, 为实测值, 为通过模型计算得到的预测值,n
为数据个数。
首先,通过公式计算t统计量,以例2-6中的数据进行计算,得到t
=12.23 ;
其次,选择显著水平,即检验可靠性程度 ,一般取
0.05 ,自由度为(n - 2),查 t 检验表以确定临界值 ,如例2-6 中有
;
最后,进行判断。 当 时,说明变量
x 与 y 间关系显著,其可靠性程度为1- 。当
时,说明
x 与 y 之间没有明确的关系,模型中引入变量 x 是错误的,用该回归模型进行预测是不可行的。在例
2 - 6 中,由于 t = 12.23>2.447 ,所以 x 与
y 之间存在关系显著, t 检验通过。
(3)相关系数检验
相关系数r是用来检验两个变量之间是否有线性关系,也即变量间的相关程度。其计算公式为:
。
其中 , ,从数学上可以证明
r 有:-1≤r≤1。
当|r|=1 时,实测值完全落在直线段上,说明Y
与X有完全的线性关系;当r=0时,说明 Y 与 X 不存在线性关系;当 |r|<1 时,说明
Y 与 X 有一定的线性关系。
由此可知,只有当 |r| 接近于 1 时,才能使用一元线性回归预测模型来描述
Y 与 X 关系。在实际中,|r| 一般大于 0.7 也就可以了。
在例2-6中,计算相关系数 ,从而得到家电产品与工资总额
之间有很 强的线性关系。
3.预测
通过了检验后,即可进行预测。 在例2-6中,假设从财政部门得到消息,某月工资发放总额将为 60 亿元,则估计销售额为 (亿元)。
|