hp高性能计算系统技术方案建议书内容摘要:

根据任务的并发情况来适当调整。 根据用户计算需求的预测,该 SMP 计算服务器应至少达到以下性能: 1) 同时运行 56 个 ANSYS 系统级任务(每个 600 万单元),计算时间不超过 12小时(夜间运行); 2) 部件级 ANSYS 任务(每个 200 万单元)的计算时间在 12小时内(白天运行); 用户目前此类应用用户有 5人,按未来 10 人来规划。 白天考虑 45个部件级的并发。 计算依据上述要求和实测数据:  ANSYS 实际测试结果: 1个 7 万单元任务, 4 个 CPU, 8GB RAM,运行时间: 2分 15 秒;  本次选择 的芯片,性能比测试机配置芯片性能高;  ANSYS 提供标准题的计算要求: 600 万单元的任务,要求 20GB 内存; ***高性能计算系统方案建议书 中国惠普有限公司 13 系统级并发任务对 CPU 数目要求如下: 6任务 *(600 万 /7 万 )*()*(2 分钟 /720 分钟 )*4CPU= 结论:对于在 12 小时内完成 6 个系统级任务,按每个任务分配 1 个 CPU,共需 6个 CPU 即可实现。 如果每个系统级任务分配 2个 CPU,共占用 12颗 CPU,只需不到 6个小时即可完成计算。 部件级并发任务对 CPU 数目要求如下: 5任务 *(200 万 /7 万 )*()*(2 分钟 /90 分钟 )*4CPU=11CPU 按每个任务分配 23个 CPU,共需 11 个 CPU。 结论:对于在 小时内完成 5个系统级任务,共需 11 个 CPU 即可实现。 整个系统配置 CPU 数目如下: 按照白天在 个小时内完成 5 个并发部件级任务和晚上并发 6 个系统级人物的最大要求,考虑其他应用如 Nastran、 Marc、 LSDyna 任务的并发计算要求,建议本次 SMP 系统的 CPU 配置总数为 12 个。 系统对内存的要求如下: 我们以 ANSYS 应用对内存的要求作为估算标准。 1700 万单元 ANSYS 标准题的内存要求约为 60GB。 对于本系统来说,系统最大负荷时的并发任务量总计最大为 6 x 600 万单元,因此,我们建议本次 SMP 系统内存配置为 128GB。 SMP 计算服务器型号及配置 根据以上分析,我们配置 16CPU 和 128GB 内存的 HP Integrity rx8620 安腾 ***高性能计算系统方案建议书 中国惠普有限公司 14 服务器作为 SMP 计算服务器,并安装在 2 米高机柜内。 HP Integrity rx8620 具有 、 64GB/s 内存带宽和 的 I/O 总线带宽,非常适合做高性能计算服务器,并最多可支持 32 个 CPU 及扩展至 256GB 内存。 HP Integrity rx8620 如下图所示: 除了满足上述用户的计算要求外,配置 16CPU 和 128GB 内存的 rx8620 计算服务器还可胜任超过单任务 3000 万以上单元的系统部件的计算,并在 412 小时内得到计算结果。 HP Integrity rx8620 计算服务器的配置如下: 服务器型号 HP Integrity rx862032 处理器 12*Itanium2 内存 128GB HD SyncDRAM 内存 硬盘 4*146GB 硬盘 网络接口(内置) 1*10/100/1000BaseT,接用户网络 1*10/100/1000BaseT,接管理网络 扩展网卡 1*10/100/1000BaseT,接所骨干网 DVDROM 1*DVD+RW ***高性能计算系统方案建议书 中国惠普有限公司 15 机柜 1*Rack System/E 41U, PDU 电源风扇 N+1 热拔插电源风扇 软件配置 HPUX 11i v2 TCOE 操作系统(无限用户许可) HP WorkLoad Manager(WLM)动态资源管理器 HP MirrorDisk/UX 磁盘镜像软件 C/C++/Fortran 编译器 配置的 HP Integrity rx8620 还有 13 个可扩展的 PCIX插槽,未来可配置2块 Fiber Channel 2Gb适配器分别连接至 SAN(存储区 域网络 )上,以获得高性能的数据访问及所需的及可扩展的存储空间。 HP Integrity rx8620 最多可扩展 32 个 PCIX插槽,满足 I/O 扩展的需要。 基于 EPIC 的安腾芯片技术 针对高性能计算应用对高性能的需求, HP 在系统设计上允许通过使用不断更新的 IPF 系列产品、采用先进的芯片组、使用更高性能的基础节点、支持更多的节点和提供更高的带宽等多种途径扩展系统的规模,提供高性能和最大的性能扩展空间,满足当前和为适应当前飞速发展的计算需要 , 一个高性能计算的全新时代应运而生 , 而 HP正是以其基 于第二代 Itanium2处理器的安腾服务器执业界之牛耳。 未来各种高端应用的需要。 具有革命意义的安腾处理器家族架构由 HP 与 Intel 共同研制开发 , 它基于全新的 EPIC 体系结构 , 降低了平台的成本 , 提高了其性能和可扩展性 . 基于Itanium2 的 HP 系统的速度比上一代产品快两倍 , 轻松超越 IA32 和基于标准RSIC的系统的性能 . 基于 Itanium2的惠普服务器能够提供更强大的功能 , 更多的应用 , 附加的特性 , 以及更广泛的解决方案。 IA- 64 体系结构在吸收 RISC 体系结构经验教训基础上另辟蹊径,一开 始就走开放性的道路,充分利用现代芯片制造工艺发展成果、提供足够的资源;同时, ***高性能计算系统方案建议书 中国惠普有限公司 16 通过力争成为新的高端工业标准、扩大批量来降低成本。 它的基本设计思想是:提供一种新的机制、充分利用硬软件协同能力来提高指令并行度:一方面大力开发先进的编译程序,消除程序中的条件转移指令、并基于猜测机制越过转移和存储指令界限调度指令的执行次序,把程序员利用串行语义编写的源程序转换成由可并行执行指令段序列组成的目标程序;另一方面使得处理器具有足够资源和智能,来纪录编译程序所发现的程序中可并行执行指令段之间的划分信息,并保证在程序运行过程中 发现猜测和调度有错时仍然给出正确结果。 对 IA- 64 体系结构处理器来说,所执行的目标程序中可并行执行的指令段已经由编译程序显性地标识出来了、指令间的数据相关性和过程相关性也已经由编译程序消除了,使得处理器只需使用相对简单的逻辑来实现很高的指令级并行度( ILP)。 相反,传统的 RISC 处理器没有足够的资源来纪录编译程序所产生许多有用的信息,也没有充分利用现代编译程序强大的对程序执行过程的调度能力。 虽然在 RISC 体系结构下,设计师们也使用编译程序来优化目标程序、为处理器提高 ILP 创造条件。 但是,处理器所执行的基本上 是隐性并行和包含大量相关性的目标程序,发现并行、线路预测、动态调度等提高 ILP 的无序执行技术、完全是由处理器硬件利用复杂的芯片逻辑来实现的。 尽管两种体系结构之间存在着许多差别,但是执行显性并行或者隐性并行目标程序是其中最主要的本质差别。 所以最初发明这种新体系结构的惠普公司把它称为显性并行指令计算( EPIC)体系结构。 ***高性能计算系统方案建议书 中国惠普有限公司 17 除了强有力的编译程序外, IA- 64 体系结构微处理器必须提供足够的资源来实现 EPIC 设计思想、提高并行度和实现高性能,包括: 新颖的指 令集:允许编译程序产生由并行指令段组成的目标程序,并纪录指令段间的划分; 大寄存器空间:为编译程序通过寄存器换名等技术消除相关性、产生尽可能在寄存器中进行运算的优质目标程序提供充分的余地; 具有足够长度的指令:便于在指令中访问大寄存器空间中多个寄存器和消除程序中转移指令; 足够的指令发送端口和派送网络:用于提高每个时钟周期发送到指令数和提高发送到速度和效率; 多种类型的新型寄存器:允许编译程序越过条件转移和存储指令的界限调度目标程序中访问内存指令的位置、消除相关性,并弥补调整位置所产生的错误; 更多的浮点执 行部件:有利于处理器实现高并行度的浮点计算; 更多的整数和多媒体运算执行部件:有利于处理器实现高并行度的整数和多 ***高性能计算系统方案建议书 中国惠普有限公司 18 媒体信息处理; 更多的芯片上高速缓存:有利于提高缓存命中率、降低内存延迟; EPIC 体系结构处理器提供的寄存器资源 IA -64 的EPIC 体 系结构是 对传统RISC 体 系结构的 重大革新, 许多方面 突破了 RISC 体系结构的局限、发展了 RISC 体系结构,为利用新制造工艺和技术、按照摩尔定律预示的速度提高处理器性能提供了可靠的保证。 ***高性能计算系统方案建议书 中国惠普有限公司 19 高性能计算环境 HPUX 11i TCOE HP Integrity rx8620 采用 HP_UX 11i V2(现在成为唯一可支持安腾芯片的64位 UNIX操作系统 )操作系统 (TCOE)提供高性能计算环境的基础 ,并配合相应的系统管理软件、语言编译器、并行模式、相关数学库 ,还可支持目前流行的各种第三方高性能计算商业软件包和应用软件包 ,例如 Platform 的 LSF(负载平衡软件 )和 checkpoint, Etnus 的 TotalView, Pallas 的 Vampir 及 Gaussian 等等 ,这些可根据实际要求灵活 配置 , 以运行高性能计算应用程序和商业软件 (含数据库软件 )。 HP_UX11i系统下的 C,C++和 Fortran编译器展示出卓越的实际应用性能 , 操作系统库充分利用了 Itanium2 架构的先进技术 ,其中包括 : MLIB。 一系列子程序 , 为科学和技术计算提供了常用数学软件 , 并针对Itanium2 架构进行了优化。 HP MPI。 实现对 Itanium2 架构信息传递接口的高性能 , 为开发人员提供了API 和软件库来支持下有效 ,可移植的并行信息传递的应用 , 是分布式计算的理想选择。 计算任务提交及管理 所有向 HP Integrity rx8620 计算服务器提交的任务其所需的 CPU 内存等系统资源是通过 HP Workload Manager(WLM)动态资源管理工具来进行管理的。 HP Workload Manager(WLM)是一个非常简单、高效、易用的资源分区和管理工具,通过它,系统管理员可根据计算服务器的资源情况及提交任务的优先级给使用用户灵活分配和调度 CPU、内存及 I/O 等系统资源,当更高优先级的任务提交后, HP WLM 可动态调整系统资源的分配,保证高优先级的任务获得所需的资源。 ***高性能计算系统方案建议书 中国惠普有限公司 20 HP WLM 动态资源管理可通过本地或远程终端进行管理,其界面如下图所示。 ***高性能计算系统方案建议书 中国惠普有限公司 21 HP rx8620 计算服务器的特点和优势 HP Integrity rx8620 是具有非常高性能价格比的 SMP 计算服务器,非常适合三院三部的结构类计算任务的运算。 其特点和优势如下: 1) 业已经测试证明的结构类高性能计算架构 用户现场测试结果表明, HP Integrity安腾服务器的架构最适合作为 Ansys、Nastran、 Marc 等应用的计算平台。 2) 优越的系统架构和 CPU 芯片技术优势 与用户现场测试服务器的架构相同的 HP Integrity rx8620高端 SMP服务器,提供更高的系统带宽、内存总线带宽和 I/O 总线带宽。 基于这样的架构, HP Integrity rx8620 可为计算应用带来更高的性能和更好的加速比。 另外, HP Integrity rx8620 采用基于 EPIC(显式并行指令计算)技术的Itanium2 MP 芯片(注:非 Itanium2 DP 芯片),拥有更大的内存带宽和系统带宽。 与 RISC 和超标量技术不同, EPIC 技术是在程序编译阶段即实现指令的并行,这为强调并行的高性能任务实现更高的计算性能提供了基础。 3) 多操作系统支持 以及硬件分区技术给用户更多的灵活性 HP Integrity rx8620 可支持 HPUX、 Linux 和 Windows 等操作系统,并支持在同一机箱内划分成 1至 4 个完全电隔离的硬件分区( nPars)。 这样,在需要的情况下,用户可灵活配置不同大小的硬分区及分别运行相同或不同的操作系统,从而给与用户最大的系统使用灵活性。 4) 易管理的高性能计算环境 HPUX 11i TCOE HPUX 11i TCOE 提供高性能、高可靠及安全的 UNIX 操作系统基础环境,并提供 HP 高性能 C/C++和 F。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。