stata如何回归

2024-05-15

1. stata如何回归

1、生成一个自变量和一个因变量。

2、点击Statistics|linear model and related|linear regression菜单。

3、在弹出的regress中设置相关变量,然后再点确定。

4、在结果界面中,_cons为.5205279表示回归截距,说明回归方程具有统计学意义。R-squared和Adj R-squared分别为0.9905和0.9893,说明回归方程拟合效果很好。

5、回归拟合图。点击Statistics|linear model and related|Regression diagnostics|Added-variable plot。

6、在弹出的avplot/avplots中,选择“all variables”,点确定。

7、结果如下图。

stata如何回归

2. stata回归分析结果怎么看?

stata回归分析结果可以这样看:
1、看到Sig.P数值,如果数值小于0.05则说明有显著影响。
2、找到R Square数值,该自变量能够解释异变数的变异值,如显示0.763则表示两者76.3%的概率相关联。
3、找到线性值DW,查DW分布表,找到DW属于1.240~1.556之间。例如DW=1.589大于1.556,则说明不存在相关性。

回归分析使用条件:
1、线性趋势:因变量与自变量存在线性关系,一般通过散点图卡宴看出呈现一条直线。
2、满足独立性条件:因变量和因变量之间需要相互独立。
3、满足正态性:对自变量的任一个线性组合,因变量均服从正态分布。
4、满足方差齐性:方差不齐可进行加权的最小二乘法。

3. stata回归分析结果怎么看?

stata回归分析结果看法如下:
操作设备:戴尔笔记本电脑
操作系统:win10
操作程序:stataSE 15。
1、首先生成一个自变量和一个因变量。

2、点击Statistics|linear model and related|linear菜单。

3、在弹出的regress中设置相关变量,然后再点确定。

4、在结果界面中,cons为.5205279表示回归截距,说明回归方程具有统计学意义。

5、在弹出的avplot/avplots中,选择“all variables”,点确定即可。

stata回归分析结果怎么看?

4. stata回归分析结果怎么看?

结果显著就是回归系数显著地不等于0.所以是看P值。回归时,得到一个系数,这个系数一般是不等于0的。但是,系数计算出来后,会给出一个误差。
你看后面误差范围,如果中间有0,比如,在-1.5到2.0之间,这是给定的在一定概率范围内的系数可能取值范围。
一般你不做修改的话,这个概率默认是95%。也就是你回归结果前面的系数有95%的概率落在这之间。如果你的回归结果数值在这个范围内比较接近于0,那么统计上可能推断比如有35.6%的可能性是0,那这个结果就不显著,即P值为0.356就不显著。所以看的是P值,而不是系数。

用最小二乘法计算出公式:
(函数的形式可以由经验、先验知识或对数据的直观观察决定,或者直接使用多项式)里的系数,拟合就完成了,但是回归的工作还没有结束,还需要去研究这些系数(这个公式)的可信度,每个系数对因变量的影响,因为回归分析认为真正的拟合系数应该是一个随机变量而非确值。
拟合用最小二乘求出来的这些系数只是对真正系数的一个点估计,所以有必要继续去研究区间估计或者假设检验。总之,拟合只是求出一条曲线能反映数据的趋势就行了,但是回归的要求是更高的更精确的。

5. 求高手分析stata回归分析结果

上面左侧的表是用来计算下面数据的,分析过程中基本不用提到
右侧从上往下
1.Number of obs 是样本容量
2.F是模型的F检验值,用来计算下面的P>F
3.P>F是模型F检验落在小概率事件区间的概率,你的模型置信水平是0.05,也就是说P>F值如果大于0.05,那么模型就有足够高的概率落在F函数的小概率区间,简单的说,如果这个值大于0.05你这个模型设定有就问题,要重新设定模型
4.R-squard也就是模型的R²值,拟合优度,这个数越大你的模型和实际值的拟合度就越高,模型越好
5.Adj .R-squard 这个是调整过的R²,跟上面R²差不多,关注一个就行了
6.Root mse 是残差标准差,值越大残差波动越大,模型越不稳定(这个值我分析的时候一般不太关注)
下侧表格
coef.是估计得到的系数值
std.err是标准差,这个数有重要意义,一般论文里都要求把标准差表示出来,这个数越大模型越不精确,越小越好
t是t检验值,t检验是用来检验某个系数是否显著区别于0的,在分析中这个值一般没什么意义,主要用来计算P>t
P>t,这个值是观察某个解释变量是否有效的主要参数,还是对于你设置的0.05的置信水平,如果这个值大于0.05说明对应的解释变量不能通过t检验,在模型中是不合格的,就需要作调整
后面两个就是置信区间了,95%的置信区间,一般在论文中意义也不大
然后分析就选取你有用的参数做了,我学经济的,一般最有用的参数就是P>F,coef,P>t,se等等,还有BIC,VIF这些,在简单回归里这些是不会计算的,需要其他命令

求高手分析stata回归分析结果

6. stata回归结果怎么看?

需要准备的工具:电脑,stataSE 15。
1、首先生成一个自变量和一个因变量。

2、点击Statistics|linear model and related|linear菜单。

3、在弹出的regress中设置相关变量,然后再点确定。

4、在结果界面中,_cons为.5205279表示回归截距,说明回归方程具有统计学意义。

5、在弹出的avplot/avplots中,选择“all variables”,点确定即可。

7. stata多元回归分析步骤是什么?

多元回归分析:一种统计分析方法

stata多元回归分析步骤是什么?

8. 如何用stata做稳健回归

如何用stata做稳健回归
大量的线性回归模型是基于最小二乘法实现的,但其仍存在一些局限性。比如说,样本点出现许多异常点时,传统的最小二乘法将不再适用,此时则可以使用稳健回归(robust regression)代替最小二乘法。
操作
下面的稳健回归使用的是犯罪数据,该数据来自Alan Agresti和Barbara Finlay的《社会科学统计方法》。变量包括美国各州编号(sid)、州名(state)、每10万人犯罪案件数量(crime)、生活在贫困线以下人口的百分比(poverty)和单亲人口百分比(single)等。我们选择使用贫穷率和单状况来预测犯罪率。
获取数据
use https://stats.idre.ucla.edu/stat/stata/dae/crime, clear
summarize crime poverty single

导入数据,并描述各个变量的统计结果,输出表格中包含样本容量、平均数、标准差、最小值和最大值。
 
OLS回归
在稳健回归之前,我们先进行OLS回归,输出结果如下。
regress crime poverty single
 
样本点分析
首先我们通过“lvr2plot”绘制残差杠杆图,通过识别离群点和高杠杆值点(杠杆点)进而识别强影响点。假如存在杠杆点的话,要确定哪些是bad leverage point,对于这些离群点我们要评估它对拟合模型的影响。
lvr2plot, mlabel(state)

由图中我们可以看出,dc、ms、fl三个点残差较大或者杠杆值比较高。库克距离是杠杆值与残差大小的综合效应,一般而言,库克距离大于1,则可认为该样本点为强影响点。接下来我们计算各点的库克距离(Cook’s Distance),并输出结果。
predict d1, cooksdclist state crime poverty single d1ifd1>4/51, noobs

由结果可以看出,dc点库克距离大于1,表明dc这一样本点对于回归结果会产生较强的影响,在之后的稳健回归中我们会对dc点进行特殊处理。
接下来我们分析数据的残差。使用rstandard这一命令,它表示标准化残差的绝对值。
predict r1, rstandardgen absr1 = abs(r1)gsort -absr1clist state absr1in1/10, noobs
 
稳健回归
我们使用“rreg”命令进行稳健回归,并输出结果如下。
rreg crime poverty single, gen(weight)

对比最开始的OLS回归,我们发现两者差异较大。并且稳健回归中的样本点数量是50,OLS回归中为51,这是因为经过前面的分析,由于dc这一异常值点对回归结果影响较强,因此在稳健回归中我们将其舍去。下面的操作表明在稳健回归中,dc样本点所占权重为零。
clist state weightifstate =="dc", noobs

下面的命令展示了其他权重较小的观察值,一般而言,残差较大的观察值权重较小,例如我们之前提到的ms点。在OLS回归中,所有样本点的权重都是1,因此稳健回归中越多的样本点权重是1,其回归结果与OLS结果越相近。
sort weightclist sid state weight absr1 d1in1/10, noobs

我们还可以通过绘制圆圈的方式形象地展现这一关系。下图中横坐标表示单亲率,纵坐标表示犯罪率,每一个圆圈表示一个样本点,圆心为该样本点在坐标中的位置,圆圈直径越大,表示该样本点权重越大。
twoway  (scatter crime single [weight=weight], msymbol(oh))ifstate !="dc"
 
拓展
我们在稳健回归分析之后,可以使用许多后续估计命令,比如test、margin等。下面的操作是我们控制贫困率之后,在不同的单亲率下预测犯罪率。我们发现,随着单亲率的提高,犯罪率也相应地上升。
margins, at(single=(8(2)22)) vsquish
最新文章
热门文章
推荐阅读