《SPSSAU|数据分析》:线性回归分析步骤总结

 2024-02-17 02:02:33  阅读 0

spss回归分析数据解读_看懂spss回归分析的结果_spss的回归分析f值是什么

1. 准备工作

一、研究目的

线性回归分析研究影响关系。 回归分析本质上是研究X(自变量)对Y(因变量,定量数据)的影响关系。 当有一个自变量时,是线性回归,也称为简单线性回归; 当有两个或多个自变量时,称为多元线性回归。 线性回归广泛应用于自然科学、社会科学等各个领域。 例如:研究吸烟、肥胖、运动等因素是否影响高血压的发病; 土壤、水分、光照是否影响植物生长等

2.数据类型

线性回归要求因变量Y(解释变量)必须是定量数据。 如果因变量Y是分类数据,可以使用“高级方法”中的“logit回归”。

3. 分析需求

(1)分析项目的自变量数量一般没有要求,但一般建议不要一次性放太多。 太多很容易造成多重共线性。 如果需要处理虚拟变量,需要在“数据处理”“生成变量”中添加,可以查看:虚拟变量帮助手册:

(2)正态性检验

提供多种正态性检验方法,如:“一般方法”中的“正态性检验”; “可视化”中的“直方图”; “可视化”中的“PP/QQ剧情”。

理论上,线性回归中的因变量需要满足“正态性”,但如果数据是问卷数据,建议跳过正态性检验步骤。 原因是问卷数据是层次数据,很难保证正态性,而且数据本身的变化幅度并不大,甚至对数处理的效果也不明显。

(3) 线性趋势

线性回归模型要求自变量和因变量线性相关,可以通过“可视化”中的“散点图”查看。 如果不是线性的,可以使用曲线回归。

补充说明:相关分析和回归分析

一般来说,在回归分析之前需要进行相关分析。 原因是相关性分析首先可以了解是否存在关系。 回归分析研究是否存在影响关系。 存在相关关系,但不一定存在回归影响关系。

2.上传数据

1.上传数据

登录账户后,进入页面,点击右上角“上传数据”,通过“点击上传文件”上传处理后的数据。

2. 拖放分析项

在“通用方法”模块中选择“线性回归”方法,将Y定量数据放入上方分析框中,将X自变量放入下方分析框中,然后单击“开始分析”。

看懂spss回归分析的结果_spss回归分析数据解读_spss的回归分析f值是什么

补充说明:如果要一次拖动多个分析项,可以使用ctrl键间断选择,shift键连续选择; 左右拖动。

3. 选择参数

检查后,残差和预测值可以保存并用于进一步分析。

3. 分析

背景:分析影响员工当前工资的因素(数据已满足线性回归分析要求。参考来源:SPSS统计分析第五版)。

1. 线性回归分析结果

spss的回归分析f值是什么_看懂spss回归分析的结果_spss回归分析数据解读

从上表可以看出,模型公式为:当前薪资=-338.130+1.750*起薪+710.927*学历(年)-10.009*过往经验(月)-77.206*年龄,模型R-平方值为 0.803 ,这意味着起薪、受教育程度(年)、过往经验(月)和年龄可以解释当前工资变化的 80.3%。

当对模型进行F检验时,发现模型通过了F检验(F=476.677,p=0.000),这意味着起薪、教育程度(年)、过往经验(月),年龄会对当前工资产生影响。 另外,模型的多重共线性检验发现模型中所有VIF值均小于5,这意味着不存在共线性问题; DW值接近2,表明模型不存在自相关。 ,样本数据之间不存在相关性,模型较好。

具体分析:

(1)起薪的回归系数值为1.750(t=29.259,p=0.000),这意味着起薪会对现薪产生显着的正向影响。

(2)受教育程度(年数)的回归系数值为710.927(t=4.190,p=0.000),这意味着受教育程度(年数)会对当期工资产生显着的正向影响。

(3)过去经验(月)的回归系数值为-10.009(t=-1.762,p=0.079>0.05),这意味着过去经验(月)对当前工资没有影响。

(4)年龄的回归系数值为-77.206(t=-1.53​​5,p=0.126>0.05),这意味着年龄对当前工资没有影响。

附加说明如下:

2. 模型预测

提供模型预测。 输入自变量后,模型预测当前薪资约为9971元(数据结果仅供案例分析)。

spss回归分析数据解读_spss的回归分析f值是什么_看懂spss回归分析的结果

3. 模型结果图

您可以直观地看到自变量和因变量之间的关系(基于回归系数)。

spss回归分析数据解读_看懂spss回归分析的结果_spss的回归分析f值是什么

4. 模型总结

spss的回归分析f值是什么_看懂spss回归分析的结果_spss回归分析数据解读

从上表可以看出,以起薪、受教育程度(年)、过往经历(月)、年龄为自变量,当前工资为因变量进行线性回归分析。 从上表可以看出,模型R方值为0.803,这意味着起薪、受教育程度(年)、过往经历(月)、年龄可以解释当前工资变化的80.3%。

5.ANOVA表分析

当对模型进行F检验时,发现模型通过了F检验(F=476.677,p=0.000),这意味着起薪、教育程度(年)、过往经验(月),年龄会对当前工资产生影响。 有影响关系。

6.回归系数分析

spss回归分析数据解读_spss的回归分析f值是什么_看懂spss回归分析的结果

总结分析表明,起薪和受教育程度(年限)会对现期薪酬产生显着的正向影响。 但是,过去的经验(月数)和年龄不会影响当前的工资。

PS:此外,还提供

显示具体的回归系数值和相应的置信区间,直观地检查数据的显着性。 如果置信区间包含数字0,则表示该项不显着。 如果置信区间不包含数字0,则表示该项显着。 。

4. 常见问题

例如有两个问题:“我愿意推荐给我的朋友”和“必要时我会再次使用它”。 这两个问题就是“忠诚”的体现。 但现在需要的是整个“忠诚”,而不是两个特定的头衔,

具体操作如下:

spss回归分析数据解读_spss的回归分析f值是什么_看懂spss回归分析的结果

VIF 值用于检测共线性问题。 一般来说,VIF值小于10表示不存在共线性(严格标准是5)。 有时以公差值作为标准,公差值=1/VIF,所以公差值大于0.1表示不存在共线性(严格大于0.2)。 VIF和容差值之间存在逻辑对应关系,因此可以选择两者之一,并概括地描述VIF值。

如果出现多重共线性问题,一般有三种解决方案。 一是采用逐步回归分析; 另一种是采用岭回归分析; 三是进行相关性分析,手动剔除相关性非常高的分析项,然后进行线性回归分析。

控制变量是指可能干扰模型的项目,如年龄、受教育程度等基本信息。 从软件的角度来看,不存在“控制变量”这样的术语。 “控制变量”是自变量,所以直接将其放入“自变量X”框中即可。

有效样本不足是指分析时,可分析的样本量低于方法所需的样本量。 解决方案是增加样本量。 一般来说,样本量至少要求是变量数的5-10倍,这样结果才更有参考意义。

标准化回归系数是消除量纲影响后的回归系数,可以用来比较各自变量的“重要性”。 如果目的是预测模型,通常使用非标准化回归系数。

5. 总结

线性回归分析步骤总结如下:

第一步:首先分析模型情况,包括模型拟合(例如R为0.3,则表示全部),是否通过F检验(F检验用于判断是否至少有一个

步骤2:分析显着性 步骤3:确定X和Y之间关系的方向。回归系数B大于0表示有正向影响,反之亦然。

步骤4:其他如比较影响程度(回归系数B值与X对Y的影响程度相比的大小)。

标签: 回归 线性 工资

如本站内容信息有侵犯到您的权益请联系我们删除,谢谢!!


Copyright © 2020 All Rights Reserved 京ICP5741267-1号 统计代码