sas的生存分析正式(编辑修改稿)内容摘要:

种: FORWARD(或 F),按照规定的 P值 SLE从无到有依次选一个变量进入模型; BACKWARD,按照规定的 P值 SLS从含有全部变量的模型开始,依次剔除一个变量; STEPWISE,按照 SLE的标准依次选入变量,同时对模型中现有的变量按 SLS的标准剔除不显著的变量; SCORE,采用最优子集选择法。 其中, SLE选择项用于指定协变量进入模型的显著水平, SLS选择项用于指定协变量停留在模型中的显著水平,缺省值皆为。 Cox回归的 SAS程序 • STRATA语句:比例风险的假定可能不会对所有的层都成立,此时需要作分层分析。 STRATA语句要求按照分层变量名列的水平数拟合一个多层的 Cox模型。 与 BY语句不同,后者是要求按分组变量名列分别估计模型及参数。 • PHREG过程中还可以加入编程语句用以创建模型中的新的自变量,但不能用以修改应变量,截尾变量,组变量或分层变量的值。 当省略所有的选项,并且只有一个分类自变量(分组变量)时,模型的检验相当于生存曲线的比较。 例题- COX回归 • 为探讨某恶性肿瘤的预后,某研究者收集了 63例患者的生存时间、生存结局及影响因素。 影响因素包括病人年龄、性别、组织学类型、治疗方式、淋巴结转移、肿瘤浸润程度,生存时间 以月计算。 试用 Cox回归模型进行分析。 45 本章小节 • 在医学研究中,常常用随访的方式来研究事物发展的规律。 例如,了解某药物的疗效,了解某仪器设备的使用寿命,了解手术后的存活时间等等。 这种研究的特点是追踪研究的现象都要经过一段时间,统计学上将这段时间称为生存时间。 生存分析就是用来研究生存时间的分布规律以及生存时间和相关因素之间关系的一种统计分析方法。 本章小节 • 生存数据,指的是生存时间以及与生存时间有关联的一组独立变量。 这里主要解释与生存时间有关的几个概念。 在生存分析中将生存时间定义为从某起始事件起到某终止事件为止所经历的时间跨度。 所以,生存时间也称为失效时间。 • 描述生存时间分布规律的函数统称为生存时间函数。 常用的有生存函数、死亡函数、死亡密度函数和风险函数。 进行生存分析有四种基本方法:统计描述、非参数检验、半参数模型回归分析、参数模型回归分析。 本章小节 • 本章介绍了生存率的两种估计方法:乘积极限法和寿命表法,以及结合实例介绍了进行生存率估计两种方法的 SAS程序。 最后,重点介绍了 Cox模型、 Cox模型的参数估计、 Cox模型的参数检验、 Cox模型的意义解释、 Cox模型的应用和 Cox模型的 SAS分析实例( PHREG过程)。 我们需要重点掌握乘积极限法和寿命表法、 Cox模型的意义和应用,尤其是 Cox模型的意义和应用(PHREG过程)。 相关、回归与多元回归 SAS应用 蒋红卫 Email: 学习目标 • 掌握直线相关的定义,熟悉简单相关系数的计算; • 掌握直线相关分析的 SAS程序( CORR过程以及选项); • 掌握直线回归的模型假设以及计算方法; • 了解直线回归应用的注意事项; • 掌握直线回归分析的 SAS程序( REG过程以及选项)。 概述 • 在医学上,许多现象之间都存在着相互联系,例如身高与体重、体温与脉搏、年龄与血压、钉螺与血吸虫感染等。 而有些事物的关系是互为因果的,如上述钉螺是因,感染血吸虫是果;但有时因果不清,只是伴随关系。 例如父母的兄弟,兄高,弟也可能高,但不能说兄是因、弟是果,这里不是因果关系,而可能与社会条件、家庭经济、营养、遗传等因素有关。 概述 • 相关是解决客观事物或现象相互关系密切程度的问题,而回归则是用函数的形式表示出因果关系。 有相关不一定因果关系;反之,有因果关系的,一定有相关。 我们称‚因‛的变量叫因变量,习惯上用 Y表示。 以横轴代表自变量 X,纵轴代表依变量 Y,可以将一群观察事物的两种关系在坐标图上以 P( X, Y)的方法定位,作出一群散点图,便可在图上看出两者的关系。 • 相关分析和回归分析是研究现象之间相关关系的两种基本方法。 所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度。 直线相关分析介绍 • 设有两个变量 x和 y,变量 y随变量 x一起变化,并完全依赖于 x,当变量 x取某个数值时, y依确定的关系取相应的值,则称 y是 x的函数,记为 y = f( x),其中 x称为自变量, y称为因变量。 各观测点落在一条线上。 • 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。 当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化,变量间的这种相互关系,称为具有不确定性的相关关系。 直线相关分析介绍 • 与函数关系不同,相关变量间关系不能用函数关系精确表达,一个变量的取值不能由另一个变量唯一确定,当变量 x取某个值时,变量 y的取值可能有无数个,各观测点分布在直线周围。 • 按相关程度划分可分为完全相关、不完全相关、和不相关: 不相关 • 如果变量间彼此的数量变化互相独立,则其关系为不相关,即没有任何相关关系。 自变量 x变动时,因变量 y的数值不随之相应变动。 完全相关 • 如果一个变量的变化是由其他变量的数量变化所唯一确定,此时变量间的关系称为完全相关。 即因变量 y的数值完全随自变量x的变动而变动,它在相关图上表现为所有的观察点都落在同一条直线上,这种情况下,相关关系实际上是函数关系。 所以,函数关系是相关关系的一种特殊情况。 不完全相关 • 如果变量间的关系介于不相关和完全相关之间,则称为不完全相关。 大多数相关关系属于不完全相关,是统计研究的主要对象。 正相关和负相关 • 正相关:两个变量之间的变化方向一致,都是呈增长或下降的趋势。 即自变量 x的值增加(或减少),因变量 y的值也相应地增加(或减少),这样的关系就是正相关。 • 负相关:两个变量之间变化方向相反,即自变量的数值增大(或减小),因变量随之减小(或增大)。 线形相关和非线形相关 • 直线相关(或线性相关):当相关关系的自变量 x发生变动,因变量 y值随之发生大致均等的变动,从图像上近似地表现为直线形式,这种相关通称为直线相关。 • 曲线(或非线性)相关。 在两个相关现象中,自变量 x值发生变动,因变量 y也随之发生变动,这种变动不是均等的,在图像上的分布是各种不同的曲线形式,这种相关关系称为曲线(或非线性)相关。 曲线相关在相关图上的分布,表现为抛物线、双曲线、指数曲线等非直线形式。 单相关、复相关和偏相关 • 单相关:两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量。 • 复相关:三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量。 • 在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。 相关系数 • 所谓相关分析,就是分析测定变量间相互依存关系的密切程度的统计方法。 一般可以借助相关系数来进行相关分析。 • 相关系数是表示两个变量( X, Y)之间线性关系密切程度的指标,用 r表示,其值在 1至 +1间。 如两者呈正相关, r呈正值, r=1时为完全正相关;如两者呈负相关则r呈负值,而 r=1时为完全负相关。 完全正相关或负相关时,所有图点都在直线回归线上;点子的分布在直线回归线上下越离散, r的绝对值越小。 当例数相等时,相关系数的绝对值越接近 1,相关越密切;越接近于 0,相关越不密切。 当 r=0时,说明 X和 Y两个变量之间无直线关系。 相关系数 • 简单相关系数反映两个变量之间线性相关密切程度和相关方向的统计测定 ,它是其他相关系数形成的基础。 简单相关系数的计算公式为:  22 )()())((yyxxyyxxr直线相关分析的 SAS程序 • SAS系统中进行直线相关分析的过程步是 CORR过程。 • CORR过程存在于 SAS的 base模块,可以计算 Pearson积矩相关系数、 Spearman秩相关系数、 Kendall‘s tau b统计量、Hoeffding’s 独立性分析统计量 D以及 Pearson, Spearman,以及Kendall偏相关系数。 另外,它还对用于估计可靠性的 Cronbach系数 α进行计算。 Corr过程的语句基本格式如下: • PROC CORR 选项列表。 BY DESCENDING 变量名 1...DESCENDING 变量名 n NOTSORTED。 FREQ 变量名。 PARTIAL 变量名(列表)。 VAR 变量名(列表)。 WEIGHT 变量名。 WITH 变量名(列表)。 直线相关分析的 SAS程序 • CORR过程的几条语句中, BY语句、 FREQ语句以及 WEIGHT语句与以前所介绍的过程中的完全相同,大家可以参考以前的内容。 下面简要介绍其余的几条语句。 • PARTIAL语句 :用以对所指定的变量计算偏相关系数或类似的偏统计量,可计算的偏统计量与PROC CORR语句中指定的选项有关。 但其中只有 Pearson积矩相关系数、 Spearman秩相关系数及 Kendall’s Tau b可计算相应的偏统计量。 直线相关分析的 SAS程序 • VAR语句 :VAR语句和其它过程中的也基本相同,这里 VAR语句指定的变量必须为数值型变量,至少应指定两个变量(当然只指定一个变量也可以计算,但是你必须确定你确实需要证明‚一个变量和它自身的相关系数为 1‛ ),可同时指定多个变量,此时 SAS会对任意两个变量之间进行相关分析。 直线相关分析的 SAS程序 • WITH语句 :WITH语句用来指定和 VAR语句指定的变量进行相关分析的变量。 当有 WITH语句存在时, VAR语句中指定的变量之间不再进行相关性分析,而其中的每个变量都。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。