回归模型的能解决什么问题?

2024-05-16

1. 回归模型的能解决什么问题?

多元线性回归模型表示一种地理现象与另外多种地理现象的依存关系,这时另外多种地理现象共同对一种地理现象产生影响,作为影响其分布与发展的重要因素。 

设变量Y与变量X1,X2,…,Xm存在着线性回归关系,它的n个样本观测值为Yj,Xj1,Xj2,…Xjm(j=1,2,n),于是多元线性回归的数学模型可以写为: 




可采用最小二乘法对上式中的待估回归系数β0,β1,…,βm进行估计,求得β值后,即可利用多元线性回归模型进行预测了。 

计算了多元线性回归方程之后,为了将它用于解决实际预测问题,还必须进行数学检验。多元线性回归分析的数学检验,包括回归方程和回归系数的显著性检验。 

回归方程的显著性检验,采用统计量: 


式中: ,为回归平方和,其自由度为m; ,为剩余平方和,其自由度为(n-m-1)。 

利用上式计算出F值后,再利用F分布表进行检验。给定显著性水平α,在F分布表中查出自由度为m和(n-m-1)的值Fα,如果F≥Fα,则说明Y与X1,X2,…,Xm的线性相关密切;反之,则说明两者线性关系不密切。 

回归系数的显著性检验,采用统计量: 


式中,Cii为相关矩阵C=A-1的对角线上的元素。 

对于给定的置信水平α,查F分布表得Fα(n-m-1),若计算值Fi≥Fα,则拒绝原假设,即认为Xi是重要变量,反之,则认为Xi变量可以剔除。 

多元线性回归模型的精度,可以利用剩余标准差 


来衡量。S越小,则用回归方程预测Y越精确;反之亦然。

回归模型的能解决什么问题?

2. 自回归模型的其他信息

在本例中,滞后的因变量(内生变量)作为解释变量出现在方程的右端。这种包含了内生变量滞后项的模型称为自回归模型。在这类模型中,由于在X和它的若干期滞后之间往往存在数据的高度相关,从而导致严重多重共线性问题。因此,分布滞后模型极少按(1)式这样的一般形式被估计。通常采用对模型各系数βj施加某种先验的约束条件的方法来减少待估计的独立参数的数目,从而避免多重共线性问题,或至少将其影响减至最小。这方面最著名的两种方法是科克方法和阿尔蒙方法。

3. 自回归模型的基本定义


自回归模型的基本定义

4. 回归模型是否违背了无自相关假定

回归模型是否违背了无自相关假定:
有效的常见违背基本假设的情况有异方差、自相关和异常值。
异方差
回归模型中的异方差是指随机误差项的方差不是一个常数,而是随着自变量的取值变化而变化。

由于不满足回归分析中的同方差的前提假设,异方差将可能带来以下问题:
对使用最小二乘法求解参数时,参数估计值虽然无偏,但是不是最小方差线性无偏估计。
参数的显著性检验失效。
回归方程的应用效果不理想。
造成异方差的常见原因:

模型缺少了某些解释变量,缺省变量本身的方差被包含在了随机误差的方差中。
模型本身选取有误,比如原本是非线性的,结果使用了线性模型。
其他原因,包括但不限于:
样本量过少
测量误差
异常数据
时序分析或使用面板数据等
异方差的检验:

残差图分析
等级相关系数法,又称斯皮尔曼检验