河南财经政法大学毕业论文_房价问题聚类分析(编辑修改稿)内容摘要:

聚 类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。 它是一种重要的人类行为。 聚类分析的目标就是在相似的基础上收集数据来分类。 (二)聚类分析应用范围 聚类源于很多领域,包括数学, 计算机科学 ,统计学,生物学和经济学。 在不同的应用领域,很多聚类技术都得到了发展,这些 技术方法 被用作描 述数据, 3 衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。 聚类是将 数据分类 到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。 商业上,聚类分析是细分市场的有效工具,同时也可用于研究消费者行为,寻找新的潜在市场、选择实验的市场,并作为多元分析的预处理。 生物学方面,聚类分析被用来动植物分类和对基因进行分类,获取对种群固有结构的认识。 聚类分析在电子商务中 网站建设数据挖掘中也是很重要的一个方面,通过分组聚类出具有相似浏览行为的客户,并分析客户的共同特征,可以更好的帮助电子商务的用户了解自己的客户,向客户提供更合适的服务。 从统计学来看,聚类分析是通过 数据建模 简化数据的一种方法。 传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。 采用 k均值、 k中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件 包中,如 SPSS。 本文就是用 SPSS 对与房价关系密切的几个指标进行聚类分析,从而得出合理的分析结果。 (三)聚类分析特点 首先,聚类分析简单直观。 其次,它主要应用于探索性的研究,其分析的结果可以提供多个可能的解,选择最终的解需要研究者的主观判断和后续的分析。 不管实际数据中是否真正存在不同的类别,利用聚类分析都能得到分成若干类别的解。 最后,聚类分析的解完全依赖于研究者所选择的聚类变量,增加或删除一些变量对最终的解都可能产生实质性的影响,所以在研究过程中,对指标的选择要非常慎重。 (四)聚类分析的一般步 骤 ,录入 Excel 表格。 ,如果单位不同,则用 SPSS 首先对数据进行标准化处理。 SPSS 对标准化的数据进行聚类分析。 三、房价问题的聚类分析 第一章已经说到,中国近几年的房价是普遍在上涨的,然而,住房价格上涨的同时,居民的收入也在增加。 对于“中国当前的房价到底是否合理”,存在着很大争议。 有人认为中国目前的房价是基本合理的,且当前房价水平是由于前几年房价过低的理性回升。 主流的观点则是认为中国的房 价不合理,存在着巨大泡沫。 本章选用 20xx年全国 35个大城市国民经济和社会发展统计公报的相关数据,利用国内生产总值 (GDP)、居民家庭人均可支配收入、房价收入比、人均 GDP 4 四个指标对全国 31 个省市的房价问题进行聚类分析。 (由于港、澳、台三地与大陆制度和发展水平差别较大,所以本文选择的数据不包括这三个地区,本文所选的 35 个大城市是按照国内各城市 GDP 排名取前三十五个) (一) 指标的选择 对我国各地区的房价问题进行深层分析,指标的选择具有决定性意义,这里选取下面 4 个指标作为分析的依据。 总量 GDP 即英文( gross domestic product)的缩写,也就是国内生产总值。 国内生产总值是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。 它不但可反映一个国家的经济表现,还可以反映一国的国力与财富。 进入 21 世纪以来,我国的房地产业出现了新一轮繁荣期,房价持续上升,这在相当大的程度上是国民经济发展的良好态势所带动的。 房地产业与国民经济的关系是:一方面,国民经济的发展会带动或制约房地产业的发展;另一方面,房地产业的发展又起着促进或影响国民经济的增长。 因此,本文在指标选择上将其作为考察的变量,力求反映各地区的经济增长对房价的拉动作用。 居民人均可支配收入是指居民家庭全部收入中,可用于支付生活费用的收入,人均可支配收入是按家庭全部人口计算的平均每人生活费收入,它被认为是消费开支的最重要的决定性因素。 人们都能接受这样的概念:收入高的城市,房价相应也就高,就是说,房价应当相对于可支配收入进行比较。 因为想买房子就得有钱,也就是要有可支配收入,可支配收入与购房关系紧密。 因此,本人认为选择居民家庭可支配收入作为 分析的变量是十分必要的。 它是一项综合指标,根据联合国人类住区中心所发布的《城市指标指南》,“房价收入比”是指“居住单元的中等自由市场价格与中等家庭年收入之 比”,国内学者大多将“房价收入比”这一概念定义为“居民收入和房价水平之间的比率”。 概念上的不统一直接导致认识的混乱与统计的偏差。 在此,本文采用我国现行的房价收入比的统计方法和标准。 房价收入比从数值来看即是一套房子价格同家庭年收入的比值,比如一套售价为 50 万元的房子对于一个年收入 10万元的家庭,其比值便为 5: 1。 通过合理计算准确的 房价收入比,不仅可以对市场的运行状况有个正确地认识,选择适当的入市时机,对于购房者而言,在了解自己的收入和房价之间准确的比值之后,有利于人们决定合理的房产消费方式。 在房地产市场中“买”和“租”都是合理的消费形式,根据收入房价比来选择合理的消费形式才是真正意义上的理性消费。 因此,本文选择房价收入比为考 5 察的指标变量。 GDP 人均 GDP 是一个考虑了人口因素的相对指标,如果我们只考虑国内生产总值 GDP 的总量,可能会因为没有考虑人口因素而缺乏一定的合理性。 在此,同时选用人均 GDP 作为分析的对象, 从而同时兼顾经济发展和社会人口发展,对研究我国各城市当前的房价问题是很有必要的。 (二) 各城市房价问题聚类分析 为了进行研究,我先搜集了 20xx 年 35 个大城市的上述几个指标制成表格,为了便于查看,它们是按照 GDP 的排名进行排序的。 表 21 20xx年 35 个大城市相关数据 序号 城市 GDP总量(亿元) 人均可支配收入(元) 房价收入比 人均GDP(元 ) 每平方米商品房平均房价(元 /㎡) 1 上海 43851 28482 2 北京 40321 37469 3 广州 42066 18406 4 深圳 44650 23906 5 天津 32658 14500 6 苏州 41096 10144 7 重庆 25150 7505 8 成都 29968 9412 9 武汉 29821 8900 10 杭州 39310 19415 11 无锡 38999 7868 12 南京 36200 17400 13 青岛 35227 12105 14 大连 30115 10766 15 沈阳 29340 7798 16 长沙 33662 6622 17 宁波 41657 13827 18 佛山 38040 8122 19 郑州 26600 8931 20 唐山 26647 6656 21 烟台 32930 7730 6 22 东莞 46594 7775 23 济南 35648 9461 24 泉州 35430 8119 25 哈尔滨 25222 7325 26 南通 31059 8424 27 长春 23089 7033 28 西安 33100 7034 29 石家庄 25000 7878 30 福州 32130 13829 31 合肥 27980 7200 32 徐州 23770 6801 33 滩坊 28386 8714 34 常州 36946 7516 35 大庆 28500 4800 数据来源:宜居城市研究室《 20xx年中国城市 GDP和人均 GDP 排名》、《 20xx大陆主要城市房价收入比排名》、《 20xx全国大城市房价排行》 数据进行标准化处理,是为了使具有不同量纲、不同数量级的数据能放在一起比较。 对表 21 进行数据标准化处理,得到表 22 表 22 数据标准化 序号 城市 Z1 Z2 Z3 Z4 Z5 1 上海 2 北京 3 广州 4 深圳 5 天津 6 苏州 7 重庆 8 成都 9 武汉 10 杭州 11 无锡 12 南京 13 青岛 7 14 大连 15 沈阳 16 长沙 17 宁波 1。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。