自变量包含多个分类变量和连续变量,因变量是连续变量。 如何进行线性回归?

 2024-02-15 04:01:45  阅读 0

自变量包含多个分类变量和连续变量,因变量是连续变量。 如何进行线性回归

如果因变量是连续变量,则可以进行线性回归。 自变量可以是分类变量或连续变量。 分类变量可以经过虚拟变量处理后进行分析,连续变量可以直接进行分析。

线性回归的分析过程是怎样的? 举个例子来说明。

spss回归分析是分析什么_看懂spss回归分析的结果_spss的回归分析f值是什么

一、案例与数据

一家大型商业银行在许多地区设有分支机构。 其业务主要涉及基础设施建设、国家重点工程建设、固定资产投资等项目的贷款。 近年来,该行贷款金额稳步增长,但不良贷款金额也有较大比例增长,这给银行业务发展带来了较大压力。 为了明确不良贷款形成的原因,管理者希望利用银行业务的相关数据做一些统计分析。 他们想了解“本年累计应收贷款”、“贷款项目数”和“本年固定资产投资额”对“不良贷款”有没有影响? 如果有的话,哪一个影响更大呢? 部分数据如下(数据为虚构,无实际意义):

看懂spss回归分析的结果_spss回归分析是分析什么_spss的回归分析f值是什么

2.分析问题

经理想研究“本年累计应收贷款”、“贷款项目数”和“本年固定资产投资金额”对“不良贷款”是否有影响。 如果是这样,请分析影响的程度。 其中,以“不良贷款”为因变量,以“本年累计应收贷款”、“贷款项目数”、“本年固定资产投资”为自变量,研究其影响可以考虑线性回归、方差分析等,由于自变量和因变量都是定量变量,所以选择线性回归进行分析。

3. 基本关系的初步探索

在进行线性回归之前,首先需要检查数据的基本关系,然后测试数据是否满足参与线性回归分析的基本条件。 基本关系包括数据相关性和共线性查看。

1、相关关系

回归分析之前一般需要进行相关性分析,因为只有相关性才有回归影响关系; 如果不存在相关关系,则不应存在回归影响关系。 所以初步检查,结果如下:

看懂spss回归分析的结果_spss回归分析是分析什么_spss的回归分析f值是什么

对“本年累计应收贷款”、“贷款项目数”、“本年固定资产投资额”和“不良贷款”进行两两相关分析。 除“本年固定资产投资”与“不良贷款”之间的p值大于0.05外,其他两对之间分析的p值均小于0.05,因此有不良贷款与本年固定资产投资不存在相关性,即本年固定资产投资未纳入回归分析。 接下来检查数据的共线性。

2.共线性

共线性是指由于线性回归模型中的解释变量之间存在精确相关或高度相关(例如相关系数大于0.8),导致模型估计失真或难以准确估计。 共线性的存在可能会降低估计的准确性,也可能会降低稳定性。 无法判断单个变量的影响。 回归方程的标准误差增加。 变量的显着性可能会失去意义等等。 因此,在分析之前需要检查共线性问题。

spss的回归分析f值是什么_spss回归分析是分析什么_看懂spss回归分析的结果

一般VIF值大于10(严格来说大于5),就存在共线性问题。 从分析结果可以看出,VIF值小于10,不存在共线性。 如果存在共线性问题,则不能使用线性回归,可以使用岭回归。 回归、Lasso回归等进行了分析。

4. 前置检查

大多数方法都有分析的假设或先决条件,线性回归也不例外。 线性回归分析的前提条件概括为四个:线性、独立性、正态性和方差齐性,接下来将一一检验。

1. 线性

一般来说,检验数据之间线性关系的目的是考察因变量随自变量值的变化。 可以做相关分析从侧面解释或者用散点图来说明。 散点图更直观,所以这次选择了散点图。 用图来描述(可视化→散点图)。 结果如下:

看懂spss回归分析的结果_spss回归分析是分析什么_spss的回归分析f值是什么

以“不良贷款(亿元)”为Y轴,“本年累计应收贷款(亿元)”为(亿元),是线性关系。用同样的方法创建散点图“贷款项目数”与“不良贷款”之间也存在线性关系。

spss回归分析是分析什么_看懂spss回归分析的结果_spss的回归分析f值是什么

如果不存在线性关系,可以尝试通过变量变换来修正。 常用的变量变换方法有对数变换、倒数变换等。

2.独立性

独立意味着残差是独立的。 特别是,时间序列数据中的连续残差之间不存在相关性。 您可以检查 DW 值。 一般来说,如果DW值在2左右(例如1.7-2.3之间),则说明不存在自相关,模型构建良好。 相反,如果DW值明显偏离2,则说明存在自相关,模型构建良好。 较差(一般来说,如果不是时间序列数据,则不需要太关注)。 尝试建立回归分析模型,发现DW值为2.286。

spss回归分析是分析什么_看懂spss回归分析的结果_spss的回归分析f值是什么

从结果可以看出,DW值为2.286,接近2,表明模型构建良好。 接下来,验证“正常性”。

3.正常

正态意味着残差呈正态分布。 其方差σ2=var(ei)反映了回归模型的准确性。 一般来说,σ越小,利用得到的回归模型预测y的精度越高。 建立回归分析模型以获得残差和预测值。 利用残差绘制直方图,看残差是否满足正态分布。 结果如下:

spss回归分析是分析什么_看懂spss回归分析的结果_spss的回归分析f值是什么

如果柱状图呈现中间高、两侧低、左右基本对称的“钟形图”,则基本服从正常分析。 然而,数据太少也可能会影响结果,导致难以呈现标准正态分布。 如果在这种情况下,如果您看到“钟形”,这是可以接受的。 从上图可以看出,数据的分布并不对称,但也有一条近似的“钟形”曲线,所以是可以接受的。 残差满足正态分布,然后验证方差的同质性。

4. 方差齐性

方差齐性是指残差的大小不随所有变量取值水平的变化而变化,即方差齐性。 那么如何进行呢? 首先,对残差和预测值进行标准化,以标准化残差为Y轴、标准化预测值为X轴绘制散点图。 如果所有点均匀分布在直线Y=0的两侧,则可以认为是齐次的。 ,结果如下:

看懂spss回归分析的结果_spss的回归分析f值是什么_spss回归分析是分析什么

从散点图中我们可以发现数据大致均匀分布在Y=0的两侧,因此可以认为方差是齐次的。 综上所述,数据满足回归分析的前提假设。 可以进行线性回归。

5.回归分析

经过以上分析和检验,最终以“不良贷款(亿元)”为因变量,“本年累计应收贷款(亿元)”和“贷款项目数(个数)”建立线性回归模型。数)”作为自变量。 分析将分两部分进行解释:模型效果和模型结果。

1.模型效果说明

模型效果描述包括F检验和模型拟合优度。

F检验

看懂spss回归分析的结果_spss的回归分析f值是什么_spss回归分析是分析什么

F检验主要观察被解释变量的线性关系是否显着。 从上表可以看出,对回归方程进行显着性检验时,统计量F=17.521,对应的p值小于0.05,因此表明被解释变量呈线性关系。 很重要并且可以建模。 那么模型的拟合优度是多少呢? 接下来是解释。

拟合优度

模型拟合的好坏一般看R平方值(决定系数,模型拟合指数)。 如果 R 平方为 0.3,则意味着自变量可以解释因变量的 30% 的变异。 一般来说,越接近1,拟合越好,但是在很多研究中我们不会太关注它的大小,因为大多数时候我们更关心X对Y是否有影响。由上表可见,模型R方值为0.614,调整后的R方值为0.579。 调整后的 R 平方也是模型拟合指标。 当x的数量较大时,调整R²比调整R²更准确。

这意味着“本年累计应收贷款(亿元)”和“贷款项目数(个)”可以解释“不良贷款”61.4%的变化。 可以看出,模型的拟合优度良好,说明模型可以解释大部分被解释的变量。 接下来解释模型结果。

2. 模型结果说明

管理者想知道“本年应收贷款累计”、“贷款项目数”和“本年固定资产投资金额”对“不良贷款”是否有影响,如果有,哪一个影响更大影响 ? 因为之前的相关性分析中,“本年固定资产投资额”与“不良贷款”之间并没有相关性。 一般来说,没有相关性就没有相关性。 因此,分析“本年累计应收贷款”、“贷款项目数”对“不良贷款”的影响与模型结果的关系,分为“是否有影响”和“影响有多大”影响”它有。 首先检查自变量是否对因变量有影响。

有没有影响

spss的回归分析f值是什么_spss回归分析是分析什么_看懂spss回归分析的结果

从上表可以看出,本年累计应收贷款分析项目t值为3.190。 p值小于0.05,表明该项目显着,即本年累计应收贷款对不良贷款有影响。 贷款项目数量分析 该项目的t值为2.126,p值小于0.05也说明该项目显着,即贷款项目数量对不良贷款有影响,且两者都会对不良贷款产生影响。 具体影响接下来会解释。

影响力水平

spss的回归分析f值是什么_spss回归分析是分析什么_看懂spss回归分析的结果

一般只有在有影响的情况下才比较影响程度。 影响程度需要通过标准化系数来检验。 标准化系数的绝对值越大,自变量对因变量的响应越大,即影响程度越大。 从上表可以看出,结果为0.524>0.349,说明本年累计应收贷款对不良贷款的影响大于贷款项目数。

另外,如果使用回归分析进行预测等,可以使用非标准化系数来构建模型公式。 详细情况不再详细描述。 您可以前往官方网站进行查看。

六、总结

使用线性回归来分析经理的问题。 首先检查数据之间的关系,探究数据是否满足线性回归分析的条件。 对数据进行处理后,进行线性回归分析,发现“本年累计应收贷款”、“贷款项目数”对“不良贷款”有影响,看标准化系数,发现“本年累计应收贷款”影响较大,为管理者后续分析提供有效信息。 分析完成。

如本站内容信息有侵犯到您的权益请联系我们删除,谢谢!!


Copyright © 2020 All Rights Reserved 京ICP5741267-1号 统计代码