sas系统和数据分析典型相关分析(编辑修改稿)内容摘要:
PHYS1 PHYS2 PHYS3 WEIGHT WAIST PULSE Correlations Between the Exercises and Their Canonical Variables EXER1 EXER2 EXER3 CHINS SITUPS JUMPS Correlations Between the Physiological Measurements and the Canonical Variables of the Exercises EXER1 EXER2 EXER3 WEIGHT WAIST PULSE Correlations Between the Exercises and the Canonical Variables of the Physiological Measurements PHYS1 PHYS2 PHYS3 CHINS SITUPS JUMPS 表 典型冗余分析结果 Canonical Redundancy Analysis Raw Variance of the Physiological Measurements Explained by Their Own The Opposite Canonical Variables Canonical Variables Cumulative Canonical Cumulative Proportion Proportion RSquared Proportion Proportion 1 2 7598d14e6a212b8db2b4f9258f0234b1 商务数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Page 10 of 44 3 Raw Variance of the Exercises Explained by Their Own The Opposite Canonical Variables Canonical Variables Cumulative Canonical Cumulative Proportion Proportion RSquared Proportion Proportion 1 2 3 Standardized Variance of the Physiological Measurements Explained by Their Own The Opposite Canonical Variables Canonical Variables Cumulative Canonical Cumulative Proportion Proportion RSquared Proportion Proportion 1 2 3 Standardized Variance of the Exercises Explained by Their Own The Opposite Canonical Variables Canonical Variables Cumulative Canonical Cumulative Proportion Proportion RSquared Proportion Proportion 1 2 3 Squared Multiple Correlations Between the Physiological Measurements and the First 39。 M39。 Canonical Variables of the Exercises M 1 2 3 WEIGHT WAIST PULSE Squared Multiple Correlations Between the Exercises and the First 39。 M39。 Canonical Variables of the Physiological Measurements M 1 2 3 CHINS SITUPS JUMPS 3. 主要结果分析 7598d14e6a212b8db2b4f9258f0234b1 商务数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Page 11 of 44 在 输出结果表 中,列出了全部变量的均值和方差;列出 了三个生理指标之间、三个训练指标之间及生理指标和训练指标之间的相关系数。 生理指标和训练指标之间的相关系数是中等的,其中 waist 和 situps 的相关系数最大为。 组内较大的相关是 weight 和 waist的相关系数为 , chins和 situps的相关系数为 , situps和 jumps的相关系数为。 在 输出结果表 中,第一对典型变量( u, v)之间的典型相关系数为 ,它应该比生理指标和训练指标两组间的任一个相关系数都大才正确。 校正值为 ,标准误差为 ,典型相关系数的平方( CanRsq)为。 矩阵 HE1 的特征值等于 CanRsq/(1- CanRsq),相对应的三个特征值,依 次 为 =( 1- ), =( 1- )和 =( 1- )。 用似然比法检验典型相关系数与零的差别是否显著,其零假设为小于此对典型变量的典型相关系数的所有典型相关系数都为 0,其 p值依次为 , 和 ,在显著水平取为 , ,说明第一对典型相关系数具有显著意义。 与用 Wilks 统计量进行多元分析的结果是等价的( F 值和 p 值都相等),测验结果为Λ( Lambda) =,近似 F 统计量= , Num DF(分子自由度) =9,Den DF(分母自由度) =, p =。 其余典型相关系数明显不显著。 另外,从第二个修正典型相关系数为 ,也可以得出以上只取一对典型相关系数的结论。 在 输出结果表 中,用原指标来线性表达第一对典型变量的系数,即: PHYS1=- + - EXER1=- - + 由于变量 的单位不一致,应考虑标准化的典型系数。 用标准化指标来线性表达第一对典型变量的系数,即: PHYS1= - + waist- EXER1= - - + 来自生理指标的第一典型变量主要为 waist( )和 weight( )的加权差,在waist 上的权数更大些,在 pulse 上的系数近似为 0。 来自训练指标的第一典型变量在 situps上的系数最大。 在给出的典型结构中,即原始 变量与典型变量之间的相关系数表中, waist 和weight 与第一典型变量 PHYS1的相关系数皆为正值,分别为 和。 因而 wight 为一抑制变量,因为它在典型变量 PHYS1 上的系数符号( ,负号)与它跟典型变量 PHYS1的相关系数符号( ,正号)相反。 来自训练指标的第一典型变量在 jumps 系数 ( )上为正号、在 situps 系数 ( )上为负号、在 chins系数 ( )上为负号。 而所有变量与第一典型变量 EXER1 的相关系数皆为负值( , 和 ),只有变量 jumps的系数符号与相关符号相反, 表明 jumps 亦为一抑制变量。 所谓的抑制变量是指它的增加或减少会引起目标变量间的相关系数的绝对值的减少或增加,即相关性减弱或变强。 一个变量成为抑制变量是因为它同典型变量的相关系数符号与系数符号相反。 为了理解这是为什么,我们以抑制变量体重( wight)为例来说明情况。 一般来说,瘦的人比胖的人起坐次数( situps)多,而来自训练指标的典型变量 EXER1 主要与起坐次数( situps)相关。 来自生理指标的典型变量 PHYS1 主要 由体重( wight)和腰围( waist)的加权差构成,而体重和腰围之间有很强的正相关性( ),我们可以近似认为体重 =腰围身高,因此典型变量 PHYS1实质上是反映一个人的胖瘦程度的某一种指标。 综上所述,我们可以通过肥胖性与起坐次数( situps)的基本相关关系得出体重( wight)和腰围( waist)与起坐次数( situps)的基本相关关系。 显然,体重( wight)或腰围( waist)大的人比小的人要肥胖,因此与起坐次数( situps)为负相关。 我们考虑简单的情况,把寻找典型变量的线性7598d14e6a212b8db2b4f9258f0234b1 商务数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Page 12 of 44 组合,假设用 多元回归方法产生,即由体重( wight)和腰围( waist)来预测起坐次数( situps)。 如果固定体重( wight)的值,腰围( waist)大的人,身高就矮,因此人倾向于较肥胖,所以预测起坐次数( situps)应该较小,这样,腰围( waist)在多元回归中的回归系数一定是负值才能使起坐次数( situps)减小。 如果固定腰围( waist)的值,体重( wight)大的人,身高就高,因此人倾向于较瘦,所以预测起坐次数( situps)应该较大,这样,体重( wight)在多元回归中的回归系数一定是正值才能使起坐次数 ( situps)增加。 从 以 上分析我们看到,体重( wight)在预测的起坐次数( si。sas系统和数据分析典型相关分析(编辑修改稿)
相关推荐
l preplot rotate=promax reorder plot outstat=fact_all。 run。 proc factor data=socecon method=ml heywood nfacotors=1。 run。 proc factor data=socecon method=ml heywood nfactors=2。 run。 proc factor
非线性回归模型为 : y=b0*(1exp(b1*x) proc nlin method=gauss NonLinear Least Squares Grid Search Dependent Variable Y B0 B1 Sum of Squares NonLinear Least Squares Iterative Phase Dependent Variable Y Method:
res Under H0 Under H0 Score 1 7 2 6 3 7 Average Scores Were Used for Ties KruskalWallis Test (ChiSquare Approximation) CHISQ = DF = 2 Prob CHISQ = 上海财经大学经济信息管理系 IS/SHUFE Page 7 of 13 结果说明:输出一张单 层的 3行
之后不起作用, lstknm的长度为 6,所以显示的值分别为’深发展’和’大秦铁’。 Obs lstknm 1 深发展 2 大秦铁 上段程序的正确写法: data a。 lstknm=’深发展’。 data b。 lstknm=’大秦铁路’。 data c。 length lstknm $12。 /*length语句放在 set语句之前 */ set a b。 proc print。
print data=testd4。 Run。 在 OUTPUT 窗口中显示的运行结果 如 图 所示。 图 用列指针控制读入外部文件后的 SAS 数据集 c7505695adb36f18f7e25cf5d2462a90 SAS 系统和数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Created by Page 7 of 18 变量表 (输入格式表 )是一种分组格式表
商务数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Page 10 of 30 3. 结果分析 表 (a)包括基本统计数,即每一变量的平均数、标准差。 表 中输出结果( b)为简单相关系数矩阵。 表 ( c)为输出相关矩阵的特征值。 表 输出结果( d)为特征向量。 我们从相关矩阵出发进行主成分分析。 从表 中输出结果 (c)可以看出,在最后一列累计贡献率中