高可用与高性能计算系统的构建与应用--中心机房建设内容内容摘要:

多数新或即将发布的应用软件都对此类技术提供了支持,整个软件市场其实已经为多核心处理器架构提供了充分的准备。 3.高性能计算 这里必须强调,如果要让多处理器系统达到最大性能,就必须充分利用所有可执行单元 ,让所有执行单元都有活可干.目前,大多数操作系统已经支持并行处理,在操作系统设计上,从进程( Process)演化出线程( Thread),最主要的目的就是更好地支持多处理器。 进程是系统资源管理的最小单位,线程是程序执行的最小单位。 将传统的单进程单线程的计算程序改造为多线程并行计算程序.可以显著提高计算性能,当然这就涉及许多算法的重新设计 ,并非改变编译选项就能达到 . 3.高性能计算 IA( Intel Archetecture)将 HPC带入全新阶段。 IA集群的瓶颈在于机间通信.通过经济高效的集群方式(例如刀片式结构),可以达到与 RISC系统相抗衡的计算能力与运算效率。 最新公布的 TOP500强中, IA架构的系统已经达到 119套,最重要的是,在入围 TO的 IA构架系统中,有超过 3成的系统应用于商业计算领域。 运用的领域涉及金融预测、药物相互作用分析、基因研究、数据挖掘等。 HPC开始步入主流。 3.高性能计算 支持集群计算机并行程序开发的软件包, 目前世界上比较流行的有( PVM、 Express、Linda、 MPI)。 其中 MPI(Message Passing Interface)正成为并行程序设计事实上的工业标准。 当前通用的是。 正在制定的,还支持 MPI的 I/O规范和进程管理规范。 MPI的主要内容是一个消息传递函数库,可以嵌在 C、 C++、 Fortran 等程序设计语言中调用。 实现并行进程之间通过网络相互通信,传递的消息可以是指令、数据、同步信号或中断信号。 Server Hardware GigaNet Myri Fast Ether VIA TCP/IP GM MVICH LAM/MPI MPI/PRO MPICH Parallet Applications 图 Beowulf集群组件视图 3.高性能计算 MPI 提供的通信规约主要是阻塞式 /同步式( BLOCKING COMMUNICATION)和非阻塞式 /异步式( NONBLOCKING COMMUNICATION),通信应答关系十分严谨,两种通信方式都支持点 — 点通信和聚合通信。 点对点通信包括 3种模式 :标准 (Standard) 模式、同步 (Synchronous) 模式和预备(Ready)模式。 聚合通信包括聚合同步和数据交换两方面。 聚合同步指调用该操作的任务要等到组内所有成员都达到该同步点后才继续往下执行。 3.高性能计算 数据交换指在一组任务之间一起进行数据交换 ,它包括 4种模式 :  广播 (Broadcast),组内一个成员的数据发送给所有成员;  数据分发 (Scatter),组内横向顺序数据交换转为纵向数据;  数据聚集 (Gather),将一个组内纵向数据交换按序传给各个组;  全数据聚集 (Alltoall),将所有组内数据进行纵横方向的交换。 3.高性能计算 使用 Cluster实现 HPC的关键同样是将传统的单进程单线程的计算程序改造为节点机上并行进程之间通过网络相互通信的并行计算程序.算法的从新设计是最大的难点. 对 HPC系统的性能评价是以测试浮点运算性能为基准的。 在计算机科学与工程应用领域内,浮点计算工作量占很大比例,因此机器的浮点性能对系统的应用有很大的影响。 3.高性能计算 自 70年代中期以来,国际上曾开发过一批基于 Fortran语言的求解线性代数方程组的子程序。 1979年正式发表了 Linpack包,因为线性代数方程组在各个领域中应用广泛,这个软件包很自然地成为测试各种不同类型机器性能的测试程序。 Linpack测试的基准是用该包的全精度( 64位字长)子程序求解 100阶线性方程组的速度。 测试的结果以 Mflops(每秒百万次浮点运算)作单位给出。 Linpack已被国际上公认为各类计算机的主要测试程序之一,并成为广大用户采购机器和各计算机厂商推销计算机的一项重要性能值表。 3.高性能计算 随着高性能并行机的飞速发展,原来 Linpack所规定的求解 100阶方程组的规模显然不能充分反映这些计算机的能力。 为此到 80年代后期, Linpack中又加上规模 n=1000的最佳测试结果,允许根据各计算机系统的具体硬件环境,修改原来算法,以尽可能达到接近峰值的最佳结果(所谓的 “ TPP”值,Toward Peak Performance)。 HPL( High Performance Linpack)测试结果是国际 TOP500排名的重要依据。 由于测值的关联因素很多,探索在符合测试标准的前提下,提高 IA架构集群性能测试值的方法仍然是很有意义的研究课题。 4. 高可用集群 高可用性( High Availability, HA)集群是共同为客户机提供网络资源的一组计算机系统。 其中每一台提供服务的计算机称为节点。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。