智慧交通云平台建设方案内容摘要:

理、治安管控、侦查破案、巡逻防范、反恐处突等各项公安工 作提供服务保障。 系统的基本功能和性能如下: 海量数据存储 能够对 百亿级的海量交通监控数据进行存储,保存时间为 2 年。 海量数据实时处理、实时入库、生成索引 能够对百亿级的海量交通监控数据进行实时处理, 能够处理每天 500 万条记 录,能够实时处理约 60 条 /秒的实时数据流量。 百亿级数据秒级查询能力、秒级实时业务响应 高效实时数据查询架构,提供秒级响应时间, 1 天的记录能在 5 秒钟内查询 出来,一周记录能在 15 秒内查询出来。 主要设计思想和设计目标、设计原则设计思想: 将海量数据分解到由大量 X86 架构计算机构成的低成本云计算平台上进行实时处理, 依靠分布式云计算软件进行容错,从而提升智慧交通云平台 海量数据分析的实时性和性价比。 设计目标:利用大量性价比高的计算机,建立云计算平台,能够对流量超过 500w 条 /天的原始交通监控数据流进行实时处理。 系统具有可动态可伸缩性、高 度容错性和响应实时性,达到较之传统方案有 13 一个数据量级的性能价格比提升。 设计原则: ( 1)前瞻性技术与实际应用环境相结合 14 本项目是既是先进技术应用示范项目,又是工程实施型项目。 把握技术正确 性和先进性是前提, 但 是前瞻性技术实施必须在云计算平台的实际应用环境和实 际监控流量的 基础上进行, 必须结合云计算平台的实际情况进行研究和开发,只 有与实际应用环境相结合才有实际应用价值。 ( 2)学习借鉴国外先进技术与自主创新相结合 在云计算平台用于超大规模数据处理方面,国内外几乎是在一个起跑线上; 但在关键技术研究及既往的技术积累方面,国外一些大公司有着明显的优势。 同 时, 智慧交通云平台所将要面对的交通监控数据流高达 500w 条 /天,是一个世界 级的云计算应用。 我们将积极学习借鉴国外先进的云计算技术,同时与自主创新 相结合, 形成功能强大、 性能卓越的能够满足实际应用环境需求的云计算 数据处 理和分析平台。 ( 3)遵循公安 320 工程相关标准规范 本项目的设计将严格遵循公安 320 工程相关标准规范。 智慧交通云平台的云计算解决方案在公安网内部,构建若干 X86 架构计算 /存储节点,虚拟出海量存储空间、处理能力和数据管理能力。 同时研制面向应用的分布式数据处理软件,满足数据 汇总、数据上报、数据入库、数据查询、数据计算和数据管理等应用需求。 图表 1 智慧交通云平台云计算解决方案 15 系统的主要技术特点实时性:平台在高效率并行分布式软件的支撑下, 可以实时完成交管数据入库、 分析和管理工作,如数据汇总、数据上报、数据入库、数据查询、数据计算 和数据管理等。 海量数据入库不会出现数据堆积现象,各类分析和查询工作基本 都在秒级完成,具有前所未有的高效性。 高可靠性: 基于对云计算可靠性深厚的研究积累, 彻底解决了当前分布式计 算平台易出现的单点故障问题。 任何一个节点出现故障,系统将自动屏蔽,而且 不会出现丢失数据的现象。 包括查询任务分配节点、计算任务分配节点、 HDFS 元数据节点、 HDFS 数据存储节点、MapReduce Job Tracker 节点、 MapReduceWorker 节点、HBase 管理节点、 HBase Region 节点等。 可伸缩性:在不停机的情况下,增加节点,平台的处理能力自动增加;减少 节点,平台的处理能力自动缩减。 这样,可以做到与云计算平台的无缝对接,根 据计算和存储任务动态地申请或释放资源,最大限度地提高资源利用率。 高性价比:采用 X86 架构廉价计算机构建云计算平台, 用软件容错替代硬件 容错,大大节省成本。 在目标性能和可靠性条件下,可比传统的小型机加商用数 据库方案节省 10 倍左右的成本。 全业务支持:采用分布式数据库模式, 绝大部分海量数据存放于分布 式平台 并进行分布式处理, 少量实时性要求很高的数据存放于关系数据库中 16 ,可支撑各 种类型的业务。 不仅支撑查询、统计、分析业务,还可支撑深度数据挖掘和商业 智能分析业务。 系统总体构架 系统基本组成与构架智慧交通云平台是一个处于交管数据采集与交管数据监测应用之间的系统。 17 从系统基本组成与构架上来看, 该共享平台由 7 个主要部分组成: 历史数据汇总 处理系统,上报数据上报系统,实时数据入库系统,交管数据存储系统,交管数 据查询分析应用系统,数据管理系统以及系统管理。 系统功能构 架智慧交通云平台需要提供的 7 大主要功能描述如下。 ( 1)历史数据汇总处理系统 历史数据汇总处理主要负责把南京市 6 个分散的数据中心的历史数据, 进行 读取解析处理,并将处理后的历史数据汇入一个统一的数据中心。 在内部处理模块上,历史数据汇总系统主要包括三个模块:读取模块、解析 模块和汇总模块。 读取模块主要负责各个数据中心历史数据的读取处理,解析模 块主要负责把读取到的历史数据解析成合理的数据格式, 而汇总模块主要负责把 解析好的历史数据上传到统一的数据中心。 在系统构架上, 为了满足 6 个分散的数据 中心处理需要, 需要在每一个数据 中心处安装一个数据汇总程序。 ( 2)上报数据上报处理信系统 上报数据上报处理负责把市数据中心的数据, 按照一定的需求 (按时间段或 一定的数据量) ,上报给省厅数据中心。 在内部处理模块上 ,上报数据上报系统主要包括三个模块:读取模块、解析 模块和上报模块。 读取模块主要负责市数据中心需要上报数据的读取处理,解析 模块主要负责把读取到的数据解析成合理的数据格式, 而上报模块主要负责把解 析好的数据上传到的省厅数据中心。 在系 18 统构架上, 为了满足市数据中心处理需要, 需要在市数据中心处安装一 个数据上报程序。 而省厅数据中心需要提供数据上报的接口。 ( 3)实时数据入库系统 实时数据入库系统主要负责全市每个卡口产生的数据实时入库。 在内部处理模块上,实时数据入库系统主要包括三个模块:接受模块、解析 19 模块和数据入库模块。 接受模块主要负责接收每个卡口产生的数据流,解析模块 主要负责把接受到的数据流解析成合理的数据格式, 而数据入库模块负责把解析 好的数据加入到市数据中心。 在系统架构上, 为了使每个卡口的数据能实时入库市数据中心, 需要在每一 个负责接受卡口数据的工控机上安装一个实时数据入 库系统。 ( 4)交管数据存储系统 原始交管数据, 将全部存储在智慧交通云平台的云存储资源中。 资源池提供 两种存储资源:一种是结 构化数据存储资源,用于存储少量的接口中间数据;另 一种是分布式文件系统, 用于存储海量的非结构化数据。 为了满足和适应数据量、 数据特征和查询处理的不同需求,将采用一种混搭式的数据存储方案。 对容量巨大、常规数据库难以处理的数据,如交管数据,将主要存储在基于 HDFS 的分布式文件系统中;这些数据将通过 HDFS 接口进行访问和计算处理。 而 对于部分数据量不大、 且查询响应性 能要求很高的数据,如用于报警比对的中间 数据,将被存放在关系数据库中。 关系数据库将采用 Sybase ASE 版本。 这些数 据将通过结构化数据存储访问接口(如 JDBC)进行访问。 在存储构架上, 若以存储 3 年的原始交管数据、 报警信息数据和针对快速查 询建立的索引数据,在 10000 条 /s 的交管数据流量下,将大约需要 512TB 的存 20 储容量,按照每个存储节点 16TB 的存储容量,加上少量的冗余节点,将需要 32 个存储节点。 ( 5)交管数据查询分析应用系统 交管数据查询分析应用主要提供包括实时监 控、 报警监控、 车辆轨迹与回放、 电子地图、报警管理、布控管理、设备管理、事件检测报警、流量统计和分析等 功能。 车辆轨迹查询处理时, 由于交管数据量巨大, 难以存储在常规的关系数据库 中,而如果直接存储在 HDFS 或 HBase 中又难以保证查询效率。 为此,需要考虑 对交管数据进行索引处理,并将索引数据存储在 HDFS 或 Hbase 中。 为了建立交 管数据索引,需要在交管数据传送到云存储系统中时,进行实时的索引处理。 但 21 由于交管数据流量巨大,需要调度使用多台服务器节点进行并行处理。 此外,用 户从客户 端发起以上各种数据查询分析任务时,也会产生大量并发的查询任务。 以上各种查询分析计算任务的处理将需要考虑在计算集群上进行并行化任务调 度和负载均衡处理。 这些并行计算任务及负载均衡处理将使用 Zookeeper 基于计 算集群完成统一的控制和实现。 在系统构架上, 以上查询分析计算任务将需要使用一个大规模数据并行计算 集群。 在编程实现上, 存储在数据库中的数据将使用常规的数据库查询语言实现; 对存储在分布式文件系统中的交管数据,针对不同的处理要求,在数据量极大而 处理实时性要求不是特别高的情况下,为了方便 对海量数据的并行处理,将采用 MapReduce 编程方式实现;而对于那些实时性要求很高的查询分析计算,由于 MapReduce 启动作业需要较长的时间开销,将不适合采用 MapReduce 编程实现, 而需要用非 MapReduce 编程方式实现。 ( 6)数据管理系统 在实际使用中, 可能用户会对某一时间段或者类型的数据特别 关心, 就可以 通过数据管理系统查询并导出这部分数据以供使用。 包括数据查询和数据导出两大部分。 数据查询让用户以自定义的条件查询出 数据,而数据导出就 是将这些数据以合理的格式导出到数据中心以外。 ( 7)系统管理 系 22 统管理主要包括智慧交通云平台的配置管理、 系统安全管理、 系统用户管 理,以及数据备份、系统故障监测复等管理维护功能。 配置管理是其中最主要的部分, 是系统各个模块正常运行的基础。 系统应能 够对网络地址、 设备地址等进行配置; 能够对用户做权限管理, 以防止数据外泄; 并能及时有效的对数据进行备份和故障检测等工作,防止数据的意外丢失。 系统 应支持树图、数据表格、网络拓扑图形式展示配置数据。 23 系统总体构架与功能模块基于以上基本的系统组成 和功能构架, 系统的详细总体构架和功能模块设计如图所示。 图表 2 智慧交通云平台总体构架与功能模块图上图中,自底向上分为五个层面。 最下层是硬件平台层,将使用南京市公安 局云计算中心所提供的计算、存储和网络资源。 从系统处理系统的角度看,这一 层主要包括云存储计算集群, 此外还包括接口和管理服务器、包括用于实现客户 端访问的 Web 服务器。 第二层是系统软件层, 包括移动的云存储系统软件, 综合分析云计算软件平 台,以及 Web 服务软件等。 云存储系统将提供基于 Sybase ASE 关系数据库的结 构化数据 存储访问能力,以及基于 HDFS 的分布式文件系统存储访问能力,分别 提供基于 JDBC/SQL 的数据库访问接口以及 HDFS 访问接口。 综合分析云计算软件 平台可提供对 HDFS、 Hbase 数据的访问,并提供 MapReduce 编程模型和接口、以 24 及非 MapReduce 模型的编程接口, 以及用于实现并行计算任务负载均衡和服务器 单点失效恢复的 Zookeeper。 第三层是智慧交通云平台中的数据层,包括原始交管数据、索引数据、用于 分析的中间数据、以及系统配置数据等。 其中,原始交管数据、索引数 据等海量 数据将存储在南京公安局云存储系统的 HDFS 分布式文件系统中, 用 HDFS 接口进 行存储和访问处理; 而其它用于分析的中间数据等数据量不大、但处理响应性能 要求较高的数据,将存储在云存储系统的关系数据库系统中,用 JDBC/SQL 进行 存储和访问处理。 第四层是交管数据处理软件层, 主要完成智慧交通云平台所需要提供的诸多 功能,包括实时监控、报警监控、车辆轨迹查询与回放、电子地图、报警管理、 布控管理、设备管理、事件检测报警、流量统计和分析、系统管理等功能。 最上层是客户端用户界面软件, 主要供用户查 询和监视相关的数据信息, 除 了事件检测报警不需要用户界面外,其它部分都需要实现对应的用户界面。 25 系统基本功能与处理方案 交管数据入库功能与处理方案交管数据入库系统总架构如图:图表 3 智慧交通云平台架构智慧交通云平台通过实时数据入库系统接入采集层的交管数据,数据分 配进入负载均衡机, 负载均衡机根据集群各节点负载情况,动态分配交管数据到 各存储处理机, 进行报警检测、建立索引等处理, 同时将交管数据存入分步式 存储系统。 26 负载均衡机功能 监控所集群机器负载情况,动态分 配交管数据。 监控所有集群机器,如果发 现问题, 那么就把分配给这台机器的交管数据重新分配到其他机器。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。