sas系统和数据分析散布图折线图和层次图(编辑修改稿)内容摘要:

Model 1 Error 198 C Total 199 Root MSE Rsquare Dep Mean Adj Rsq . Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob |T| INTERCEP 1 WEIGHT 1 上海财经大学经济信息管理系 IS/SHUFE Page 12 of 28 带,可用 CLM代替,表示作均数的置信带; ⑶ 95 表示置信度为 95%,另有两个可用值 为 90和 99。 有关散布图中 I 选项的回归参数取值,可在 SYMBOL 窗口的 TYPE 参数选项横线上键入。 后,再选择 User regress analysis 子菜单来查看或选定。 CI 表示回归线的颜色, CO 表示置信带的颜色, CV表示散点的颜色, W表示连接线的宽度, L 表示连接线的类型。 程序的运行结果显示在 GRAPH窗口中, 如图。 图中大约有 5%的数据点落在两条虚线构成的置信带之外。 四、 折线图 折线图又称曲线图,是用线 段的升降来说明现象变动情况的一种统计图,它主要用于表现在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系等。 折线图常应用于时间序列模型中,把有关时间序列的数据绘制成图形。 广义上说,模型可划分为回归模型与时间序列模型。 从数学角度看,时间序列数据的建模是构造一个包含时间序列本身、推荐函数的残差以及可选择的 其他 时间序列的函数。 我们所观测到 的 时间序列的值是时间序列过程的实现。 用描述方法判定时间序列数据的趋势后,技术分析人员往往要对该序列建立模型并预测它们的将来值。 用时间序列的数据建立模型时,可以去掉序列的 确定分量,也可以对确定部分建立一个明确的模型。 利用时间序列的 其他 组成部分建模后,把确定部分也加进去形成最终模型。 例如,股票价格趋向于沿看得见可识别的趋势移动,技术分析想尽可能地识别趋势并在趋势反转点改变投资。 然而,由于随机波动遮掩了反转点或使反转点错误地出现,因此技术分析必须借助于估计序列成分(包括趋势周期计算、季节和交易日方式的循环和非规则成分的循环)或计算序列的移动平均来估计序列的趋势。 直接使用一些股票市场的时间序列数据绘制折线图,全部趋势可能难以直观识别。 如果移去非趋势成分会使趋势更容易显现。 可以 使用 SAS/ETS 软件中 PROC X11 过程来估计和调 图 一元线性回归和 95%置信限 上海财经大学经济信息管理系 IS/SHUFE Page 13 of 28 节序列成分。 作为对使用 PROC X11过程去估计趋势成分的一种补充,可以采用平滑时间序列的数据的方法,以便移去随机波动从而揭示数据中的趋势。 一般地,通过计算数据的移动平均可实现数据的平滑。 移动平均有很多种类,主要有简单移动平均、加权移动平均和指数加权移动平均,最优长度依赖于使用的时间结构。 理解了数据中有关趋势的知识,将有助于买、卖和持有股票的决定及交易的时机。 下面,我们首先对上证指数 INDEXSH 数据集计算简单的、加权的和指数加权的移动平均线。 然后绘制 原始序列和移动平均的图形。 程序如下: Goptions reset=global gunit=pct cback=white border htitle=6 htext=3 ftext=swissb colors=(back)。 Libname Study “d: \sasdata\mydir”。 Data。 Set。 Ma10=(close+lag(close)+lag2(close) +lag3(close) +lag4(close) +lag5(close)+lag6(close)+lag7(close) +lag8(close) +lag9(close))/10。 Wma10=(10*close+9*lag(close)+8*lag2(close)+7*lag3(close)+6*lag4(close) +5*lag5(close)+4*lag6(close)+3*lag7(close)+2*lag8(close)+lag9(close))/55。 W1=。 retain ewma1。 If _n_=1 then ewma1=close。 else ewma1=w1*close+(1w1)*ewma1。 W2=。 retain ewma2。 If _n_2 then ewma2=ewma1。 else ewma2=w2*ewma1+(1w2)*ewma2。 Proc gplot data=。 plot close*date ma10*date /vaxis=axis1 haxis=axis2 overlay。 symbol1 i=join v=none L=1 h=。 symbol2 i=join v=none L=1 h= w=2。 axis1 label=(39。 Price39。 ) logbase=10 order=(100 200 400 800 1600 3200)。 axis2 label=(39。 Date39。 )。 title 39。 Shanghai StockIndex39。 Title2 ‘Close and MoveAverage ’。 Run。 程序说明: DATA 数据步创建了一个名为 INDEXMA 的 数据集,共生成了四种移动平均线,使用滞后函数 LAGn()生成了收盘价 CLOSE的十日简单移动平均线 MA10 和十日加权移动平均线 WMA10;用平滑因子 W1生成一次指数加权移动平均 EWMA1,用平滑因子 W2生成二次指数加权移动平均 EWMA2,平滑因子值较大,则对最近的序列值给出较大的权数,作为一个一般原则,较小的平滑因子适于缓缓改变的趋势序列,而较大的平滑因子适于快速改变的易变序列。 IF- THEN- ELSE 语句 的 作用是将初始化处理和后面的正常处理分开来。 RETAIN 语句 的 作用是 DATA步 从 这次到下次重复时,保留变量 EWMA1 和 EWMA2 的值。 调用 PROC GPLOT 过程绘制了收盘价和十日简单移动平均的图形,其中对纵轴( Price)定义上海财经大学经济信息管理系 IS/SHUFE Page 14 of 28 的 AXIS1 语句中加上了 LOGBASE=10(或 PI或 e)的选项,就表示该轴是以 10 为底的对数轴。 程序的运行结果显示在 GRAPH 窗口中, 如图 所示 除了用 DATA 数据步直接计算移动平均外,我们还可以用 SAS/ETS 软件的 EXPAND 过程来生成时间序列数据的简单、加权和中 心移动平均,用 SAS/QC 软件的 MACONTROL 过程生成一致加权和指数加权的移动平均控制图表。 五、 层次图 PROC PLOT 过程还能绘制层次图,又称等值线图或轮廓图。 在地理学研究中用来绘制等高线,在经济学研究中常用来画等值的利润曲线。 例如 , 线性规划中的产品混合问题,经济学的一个核心问题是在有限的资源情况下,如何合理的分配资源,使效益最大化。 假设我们要生产两种产品 X 和 Y,但受到时间 T、空间 S、能力 C 三种资源约束,在已知两个产品的单位利润为 f1(x)和 f2(y)情况下,各生产产品 X 和 Y 多少数量,才能使利润 Z 最 大化。 即: 时间资源约束: ft( x, y)≤ T 空间资源约束: fs( x, y)≤ S 能力资源约束: fc( x, y)≤ C 利润 Z= f1(x)X+ f2(y)Y 产品的单位利润一般受市场的需求和成本等因素影响 ,要销售的数量多,单价就要便宜,单位利润就会变小,但生产的数量多 ,单位成本就会低 ,单位利润就会变大,两者的平衡点在边际收益等于边际成本时生产的数量,但这仅是针对一种产品和资源不受约束的情况下。 通常的做法,是将利润函数 Z 在 X和 Y 平面上画出等值线,而三种资源的约束函数曲线也将在 X和 Y 平面上围成可行域,然后在可行域中找出( X, Y)使等值线最大。 设 f1(x)=7X+1/X,f2(y)=9Y+1/Y,那么: Z=2+7XX2+9YY2 图 对时间序列的数据用移动平均估计趋势 上海财经大学经济信息管理系 IS/SHUFE Page 15 of 28 用上面的这个函数生成一个包含三个变量 X、 Y、 Z的利润数据集 PROFIT,然后用 PLOT语句的 CONTOUR 选项就可以绘制出等值线图。 程序如下: libname study d:\sasdata\mydir。 Data。 format z。 do x=0 to 9 by。 do y=0 to 9 by。 z=2+7*xx*x+9*yy*y。 output。 end。 end。 Proc plot data= formchar=39。 ||39。 plot y*x=z /contour。 Run。 用 PROC PLOT 过程 PLOT 语句选项 CONTOUR,最多只能分成 10 个层次,由 Z 的取值来决定所属的层次。 第一层 Z的取值范围 ~ ,第二层 Z 的取值范围 ~ ,„,第十层 Z 的取值范围 ~。 每一层用一个不同的作图字符表示。 由于生成的是低 分辨率的图形,显示不清楚,我们改用 PROC GCONTOUR 过程来绘制高分辨率的层次图,最多可以绘制 100 层。 程序如下: Goptions reset=global gunit=pct cback=white border htitle=6 htext=3 ftext=swissb colors=(back)。 Proc Gcontour data=。 plot y*x=z / nlevels=20 autolabel xticknum=10 yticknum=10 nolegend。 Title 39。 Profit Gcontour39。 Run。 程序的运行结果显示在 GRAPH 窗口中, 如图 所示。 程序说明: NLEVELS=20 选项定义层次图的层次数为 20, AUTOLABEL 选项定义层次线的标签为自动生成,如图中 、 、 , XTICKNUM=10 和 YTICKNUM=10选项定义 X 和 Y 轴上刻度线的数目, NOLEGEND 选项定义在层次图的下方不显示图例,若无此选项,将显示每一层次线 Z 的具体值。 还有许多 其他 选项,如可定义各个对象的颜色 , 可选择网格线、垂直和水平参考线等。 用等值线和可行域方法研究两个产品 X 和 Y 的混合问题,还可以推广到求解 n个产品的混合问题。 此时的利润值是一个在 n 维空间的曲面,可以称为等值面,而可行域也为 n 维的一个体积。 上海财经大学经济信息管理系 IS/SHUFE Page 16 of 28 第二十一课 条形图、圆饼图和星形图 与 PLOT 过程和 GPLOT 过程的关系一样, PROC CHART 过程是用来画易生成的低分辨率的图形,输出在 OUTPUT 窗口。 而 PROC GCHART。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。