基于spss的多元回归分析模型选取的应用毕业论文(编辑修改稿)内容摘要:

个定量数据的 研究来其与淘宝交易额的关系,从而研究淘宝未来的发展趋势以及优劣态 . 原始数据如下: 第 8 页(共 30 页) 表 为消除数据之间因单位不同产生的量纲的影响,对数据进行标准化得如下数据得到 表 复相关系数 对表 的数据进行复相关系数的研究,看变量之间的复相关关系,得到如下表 的复相关系数表: 表 第 9 页(共 30 页) 表 中有带“ **”号的结果表明有关的两变量在 的显著性水平下显著相关,由上图可知, y 与 1x 的相关系数为 0,表示变量之间存在线性关系,其相关系数检验对应的概率 P 值为 ,低于显著性水平 ,说明淘宝交易额与淘宝注册人数之间相关性显著 . y 与 2xe 的相关系数 为 0,表示变量之间存在线性关系,其对应P 值为 ,小于显著性水平 ,说明淘宝交易额与我国网络普及度之间相关性显著 .y 与 3x 的相关系数为 0,表示变量之间存在线性关系,其对应 P 值为 ,小于 显著性水平 ,说明淘宝交易额与居民消费水平之间相关性显著 . y 与 4xe 的相关系数为 0,表示变量之间存在线性关系,其对应 P 值为 ,小于显著性水平,说明我国第二产业增加值与居民消费水平之间相关性显著 . 综上所述通过 SPSS 得出的相关系数的矩阵得到为: 1yxr , 2yxr , 3yxr , 4yxr . 虽然变量都通过了检验,但是可以看到2yxr和4yxr较另外两个复相关系数较低,因此对变量进行散点图的分析来了解自变量与因变量的相关关系 . 散点图看线性关系 对 y 与各个变量作出散点图 ( 1)淘宝注册人数 1x 与淘宝网交易总额 y 的相关性散点图: 图 ( 2)网络普及度 2x 与淘宝网交易总额 y 的散点图: 第 10 页(共 30 页) 图 ( 3)我国居民消费水平 3x 与淘宝交易额 y 的散点图: 图 ( 4)第二产业增加值 4x 对淘宝交易额 y 的散点图: 图 图 和 分别是 自变量 2x 和 4x 与因变量的相关系数图,可以看出自变量 2x 和因变量 y 之间呈明显的指数线性关系,而变量 4x 也是同样与因变量 y 之间呈明显的指数线 第 11 页(共 30 页) 性关系 .他们之间是非线性回归模型的关系 . 所拟合的效果不理想所以我们还需要对数据进行进一步的处理和分析,得到确切的答案 . 回归分析看拟合度 对数据进行回归分析: 表 表 是自变量与因变量得到的回归分析,可知,因变量 y 与常数项和自变量 1x , 2x ,3x , 4x 的回归的标准化回归系数分别 为 , P 检验可 以 看 到 由 上 表 可 以 看 出 常 数 项 以 及 各 自 变 量 的 P 值分别为:, 及 . 可以看出原始变量所得到的 P 值并没有全部通过检验 . 说明常数项对因变量影响不显著 . 对数据进行 t 值检验 , 在给定的  ,自由度 9211 n 的临界值时,查表得  ,其常数项的 t 值为 小于 ,说明常数项不显著 . 综上所述,可以初步得到一个模型为 : 4321 8 9 3 2 6 xxxxy  . 确定回归模型变量 综上 通过散点图、复相关系数以及回归分析可以知道由于自变量 2x 和 4x 与因变量 y之间是非线性关系,是呈指数线性关系为研究之间线性关系,所以得到的模型的拟合程度并不是很理想 .因此对自变量 2x 和 4x 进行取 e 的对数即 2xe 和 4xe 来对变量进行研究看拟合效果得到下表 . 第 12 页(共 30 页) 表 下面对表 进行变量分析与研究,通过对非线性模型中的变量的研究来了解多元回归分析中变量的选取与使用,同时对自变量进一步进行分析 . 调整后变量的相关分析 散点图 对 y 与各个变量作出散点图 ( 1)淘宝注册人数 1x 与淘宝网交易总额 y 的相关性散点图: 图 ( 2) e 的网络普及度次方 2xe 与淘宝网交易总额 y 的相关性检验: 第 13 页(共 30 页) 图 ( 3)我国 居民消费水平 3x 与淘宝交易额 y 的相关性检验: 图 ( 4) e 的第二产业增加值的次方 4xe 对淘宝交易额 y 的影响: 图 由以上四个散点图可知,其所有的点均落在了左上至右下的一条直线上,表明了数据之间存在显著相关关系 . 所以我们还需要对数据进行进一步的分析,得到确切的答案 . 第 14 页(共 30 页) 计算相关系数 ( 1)复相关系数 r 是用来衡量回归直线对于观察值配合的密切程度,即用来衡量因变量 y 与自变量 1x , 2xe , 3x , 4xe 之间相关的密切程度 . 以下是用 SPSS 对数据进行相关性分析,得到如下的相关系数图 表 图中有带“ **”号的结果表明有关的两变量在 的显著性水平下显著相关,由上图可知,y与 1x的相关系 数为 0,表示变量之间存在线性关系,其相关系数检验对应的概率 P 值为 ,低于显著性水平 ,说明淘宝交易额与淘宝注册人数之间相关性显著 . 与2xe的相关系数为 0,表示变量之间存在线性关系,其对应 P 值为 ,小于显著性水平 ,说明淘宝交易额与我国网络普及度之间相关性显著 .y与3x的相关系数为 0,表示变量之间存在线性关系,其对应 P 值为 ,小于 显著性水平 ,说明淘宝交易额与居民消费水平之间相关性显著 . y与4xe的相关系数为 0,表示变量之间 存在线性关系,其对应 P 值为 ,小于显著性水平 ,说明我国第二产业增加值与居民消费水平之间相关性显著 . 综上所述通过 SPSS 得出的相关系数的矩阵得到为: 1yxr ,2yxr ,3yxr ,4yxr . 由以上数据可以看出,各列之间存在正相关关系 . 即淘宝网注册人数 1x、 的我国网络普及度2xe、我国居民消费水平3x、e的我国第二产业增加值次方e与淘宝交易总额y存在显著的相关关系 . ( 2) 计算偏相关系数: 下面是用 SPSS 作出的偏相关系数: ① 消除我国网络普及度、第二产业增加值和居民消费水平的影响后,计算淘宝注册人数与淘宝交易额的偏相关系数为: 第 15 页(共 30 页) 表 由上可知,淘宝注册人数与淘宝交易额的偏相关系数为 . ②消除淘宝交易额、第二产业增加值和居民消费水平的影响后,我国网络普及度和淘宝交易额的偏相关系数为: 表 由上可知我国网络普及度与淘宝交易额的偏相关系数为 . ③消除淘宝注册人数、第二产业增加值和我国网络普及度的影响后,我国居民消费水平和淘宝交易额的偏相关系数: 表 由上可知, 我 国居民消费水平和淘宝交易额的偏相关系数为 . ④消除淘宝注册人数、我国网络普及度和居民消费水平的影响后,计算第二产业增加值与淘宝交易额的偏相关系数: 表 由上可知, e 的 第二产业增加值次方与淘宝交易额的偏相关系数为 . ⑤ 下表为各个变量之间的偏相关系数表,为方便,这里直接变各变量之间的偏相关系数: 第 16 页(共 30 页) r y 1x 2xe 3x 4xe y 1x 2xe 3x 4xe 表 这里我们对变量 2x 和 4x 采用的是其指数幂,是因为在对变量的相关性进行检验时,通过散点图可以看出 2x 和 4x 与因变量之间呈的是指数线性关系,是非线性关系所以对数据进行了处理 ,因为原始变量之间存在的非线性关系得出的结果不具有代表性 . 可以通过散点图看到从以上的偏相关系数来看,如果 2xe , 3x 和 4xe 保持不变, y 与 1x 之间存在相关关系, 当 1x , 3x 和 4xe 的保持不变时, 2xe 和 y 之间存在相关关系,其他关系同上,在这里就不进行一一解释 .我们也可以通过以上的偏相关系数表可以看出各个自变量之间也存在一定的偏相关关系,但是相对于自变量与因变量之间的偏相关关系较小,说明这些变量之间的选择比较显著 .但是其关系强度较前者略低,所以经过以上系数得到的偏相关系数可以看出,其相关程度较原关系的强度低,应采用原数据的自变量和因变量 . 即所采用的自变量和因变量保持不变 .通过复相关系数的计算和偏相关系数的计算结果可以看出 ,复相关系数的取值在 01 之间 ,偏相关系数的取值在 1 到 1 之间 ,由上数据便可看出偏相关系数与复相关系数之间的差距相差甚大 ,有的甚至改变了符号 . 从上可以看出通过复相关系数不能很好的确定变量之间的相关关系 ,不能明确的解释变量 ,而偏回归系数可以看出变量是否符合要求 . 从下面的回归分析中继续对变量进行研究 . 多元线性回归分析 对数据进行回归分析,得到如下结果: 表 复相关系数为 1, 判定系数为 ,调整系数为 , 估计值的标准误差为 . 第 17 页(共 30 页) 表 由上面结果的看其显著性检验结果为,回归平方和为 , 残差平方和 , 总平方 和 , F 统计量的值为 , 对应的概率 P 值为 , 小于显著性水平, 即: 淘宝交易总额 y 与淘宝网注册人数 1x 、 e 的我国网络普及度次方 2xe 、我国居民消费水平 3x 和 e 的我国第二产业增加值次方 4xe 之间存在线性关系,所以可认为所建立的回归方程有效 . 表 由上表可知,因变量 y 与常数项和自变量 1x , 2xe , 3x , 4xe 的回归的标准化回归系数分别 为 ,. 3 个回归系数 B 的 显著性水平均小于 ,这里可以认为自变量 1x , 2xe , 3x , 4xe 对因变量 y 有显著性影响 . 于是得到回归方程为 : 42 6 1 2 0 4 1 31 xx exexy  , 由上图可知对数据进行 t 值检验 , 在给定的  ,自由度 9211 n 的临界值时,查表得  ,因为 1x , 2xe , 3x , 4xe 的参数对应的 t 统计量的绝对值均大 于 ,这说明 %5 的显著性水平下,斜率系数均显著不为 0,表明淘宝网注册人数 1x , e 的我国网络普及度次方 2xe ,我。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。