项目名称:适应于千万亿次科学计算的新型计算模式首席科学家:陈内容摘要:

们在结构网格和非结构网格自适应方法的理论、算法和软件实现方面开展了系统的研究,取得了重要的创新性成果。 当前,求解离散线性和非线性方程组的 可扩展大规模并行算法成为千万亿次科学计算的关键问题,也是本课题的研究重点。 大波数离散波动问题的可扩展算法 具有广泛应用,它的突破将带动声波、电磁波、弹性波等许多重要应用的发展,对于 线性方程组 可扩展并行算法的研究具有重大推动作用,也 是 科学计算的公开困难问题。 本课题将以此为突破口,开展集成电路设计制造中电磁和流体计算方法、 三维地震波场正演问题的快速算法和成像反演方法的研究。 大波数波动离散问题的可扩展算法 时谐 Helmholtz 方程和 Maxwell 方程组是模拟声波和电磁波的基本模型。 当用某种离散化方法求解它们时,网格 尺寸必须与频率相匹配,以得到满意的逼近误差。 特别地,对高频情形 网格 尺寸必须很小,从而离散系统的规模变得非常大,其条件数也非常大(同时受到频率和 网格 尺寸的影响)。 构造求解该离散系统的高效 快速算法无疑是非常重要的。 近年来,国内外已有一些计算数学专家尝试用一些快速算法来求解此代数系统,如多重网格算法,区域分解算法等。 在区域分解方面,法国 Despres 教授首先提出 了用 Robin 型非重叠区域分解法解此类问题,从数学上来说,此类区域分解法求解 Helmholtz 方程大波数波动问题是最自然的,因为此时每个问题是适定可解的。 Despres 已证明此区域分解算法是收敛的,该方法的一个优点是算法是高度平行的,非常适合于利用平行计算机进行求解。 瑞士日内瓦大学的 Gander教授进一步研究了该算法发现在波数 50 左右,利用优化交界面上的信息获得具有较快收敛的 Robin 型区域分解法。 美国柯朗研究所的 Windlund 教授与其合作者,尝试用重叠型区域分解法来构造预条件子来处理 Helmholtz 方 程的有限元离散系统,对波数是 40 左右的波动问题进行了有效的数值模拟,但对大波数问题,该方法效果不是很好,原因是该算法要构造有效的粗空间,而在粗空间上Helmholtz 方程的数值解是不稳定的。 总而言之,到目前为止,尚没有设计出真正高效的针对大波动数问题的区域分解算法。 在多重网格方面,也有一些研究工作 ,最早的工作由多重网格专家 Brandt 教授首先提出,他称之为波射线多重网格法 ,基本思想是在粗网格上不求解大波数波动问题,而是建立所谓的射线辅助方程来进行校正,该方法对波数 50 左右的波动方程是有效的,但该方法的一 大缺陷是构造的射线问题很难实现,对变系数问题无法推广。 美国的 Elman 教授提出如果在粗网格上用 GMRES 迭代代替通常的 Jacobi和 GaussSeidel迭代来进行磨光,尽管在粗空间上迭代可能不收敛,但可以起到很好的校正作用,即消去误差的低频部分,数值显示对波数在 50 左右的波动问题,效果是明显的,能得到最优的多重网格迭代算法。 但到目前为止,对大波数问题的多重网格法还有待进行深入的研究,其困难还在于如何在粗空间上构造有效稳定的校正问题。 我们将从多个方面对该问题进行研究: 首先充分研究大波数 Helmholtz 方程和时谐 Maxwell 方程组的 谱结构,然后利用其构造尽可能小的 粗 空间并发展相应的 区域分解方法和多层网格方法。 在 Robin 型区域分解方法方面,由于对正定问题的 Robin 型区域分解法,我们已获得了一些世界领先的理论结果,其结果受到了国外计算数学家的广泛好评和引用,并已发展了一套有效的分析工具和数学技巧,我们将利用这些分析技巧和工具,进一步研究强不定问题的 Robin 型区域分解法的收敛情况。 首先对波数不是很大的 Helmholtz 方程 ,证明此时 Robin型区域分解法的收敛速度与正定问题是一样的。 进一步,再 研究大波数问题区域分解的收敛情况,由于此时方法是高度平行的,因此有望获得满意的数值结果,最后将从理论上详细分析大波数问题 Robin 型区域分解法的收敛行为,尤其要研究收敛率和波数的关系。 在多重网格方面,我们将从两方面入手考虑 Helmholtz 问题的多重网格法 ,第一是在粗网格上设计更有效的光滑子 ,特别是问题相关的光滑子,即该光滑子与原始问题直接挂钩 , 同时用 GMRES 方法代替标准的 Jacobi 和 GuassSeidel方法作粗网格光滑子 ,此时尽管光滑迭代过程是不收敛的 ,但是可以起到误差的校正作用 ,其误差的 低频部分可以消去。 此想法已被应用求解对流 扩散问题以及强间断系数问题,相信对大波数问题也会有一定的效果。 第二,我们将类似于 Brandt 教授的波射线多重网格法的思想,改造我们粗网格逼近问题。 最近,Xiaobing Feng 和武海军教授利用间断有限元对 Helmholtz 方程提出了一个不依赖于网格的稳定的数值格式,从谱等价的角度,直观上我们可以采用此离散模式来构造我们的粗空间校正问题,在粗网格上设计有效的光滑子。 纳米尺度下集成电路设计制造中电磁和流体计算 目前世界上最先进的集成电路制造工艺已经 进入到纳米尺度( 32 纳米),芯片集成度达到数亿万门数量级,芯片面积达数平方厘米。 市场上最快的单核CPU(奔腾 4)的时钟频率达 4GHz。 考虑复杂工艺偏差的可制造性设计是集成电路设计进入纳米尺度的核心、前沿问题,也是目前国际研究的热点,这包括对集成电路核心工艺的建模、仿真以及考虑工艺参数偏差下集成电路的建模、仿真算法。 进入 3 22 纳米工艺节点后,光刻机所采用的 193 纳米光源波长与掩模的特征尺寸已达到了同一个量级,光刻工艺进入了理论分辨率的极限,传统的光刻仿真方法将掩模和硅片表面假象为一个平面的假设不 再成立。 考虑掩模和硅片表面三维形貌的三维电磁散射效应的精确光刻模型和仿真算法已列为国际半导体技术发展路线图 ITRS 的前沿科学问题。 现有的时域有限差分算法、波导方法以及严格耦合波分析方法存在着计算速度慢和收敛困难的问题,不能适用于大规模问题的光刻模拟。 工业界仍缺少一套高效、成熟的三维光刻工艺仿真工具。 在基于电磁场的掩模和成像模拟中,国际半导体技术发展路线图 ITRS 明确提出一方面要对现有方法在精度、速度和内存消耗等各方面做深入细致的比较研究,另一方面也提出发展更有效率的严格电磁散射分析方法在未来集成电路工艺优化 和制造如大规模掩模缺陷检测等问题中有巨大的应用需求。 我们将结合前期 973项目开发的并行自适应有限元软件平台 PHG,发展三维光刻电磁散射问题的自适应 PML 方法,建立具有自己特点的三维光刻严格电磁场计算方法及其实现技术。 互连线的性能是决定电路性能和可靠性的关键因素之一,到了纳米工艺下,光刻、化学机械抛光等复杂工艺造成互连线几何尺寸的偏差,进一步影响互连线电学参数及其性能。 几何参数偏差驱动的互连线寄生参数提取的目的就是要在互连线建模中进一步考虑工艺参数偏差的影响,它所面临的主要挑战是计算复杂度过高:一方 面,集成电路互连线复杂的结构、庞大的规模给寄生参数提取的数值计算带来了巨大的挑战;另一方面,几何参数偏差驱动的互连线寄生参数提取需要在几何参数的随机空间中多次采样、重复求解。 因而,我们迫切需要一个高效的互连线寄生参数提取的电磁场计算方法。 目前,单核处理器性能已趋于饱和,随着并行处理时代的到来,基于并行处理的互连线寄生参数提取方法显得尤为重要。 在上一个 973 项目中我们已经取得了互连线寄生参数提取、电磁场数值计算等一系列研究成果,我们将进一步从并行自适应有限元多重网格方法出发研究复杂结构互连线寄生参数提取的数值 方法,一方面研究高效的并行有限元方法在互连线寄生参数提取中的应用,另一方面研究基于嵌套式稀疏网格的高效随机配置方法来求解互连线寄生参数提取的随机 Maxwell 方程。 由于互连线主导芯片性能,化学机械抛光 CMP 工艺会改变互连线的高度,使其偏离设计值,从而影响电路性能。 因此 CMP 工艺建模和仿真的目的是为了获得硅片上互连线的高度和介质层厚度及其偏差模型,以指导考虑芯片平整度和工艺偏差的电路分析和设计优化。 目前基于物理原理的 CMP 工艺建模和仿真涉及到研磨垫和硅片之间的粗糙接触问题的求解以及研磨液在研磨垫和硅 片两者之间复杂的三维非牛顿流问题的求解,其计算精度和计算复杂度的问题一直挑战着 CMP工艺仿真技术在可制造性设计和 CMP 工艺优化等方面的应用。 因而,我们迫切需要一个精确高效的 CMP 工艺建模和仿真算法。 在以前的研究中,我们开发了基于粗糙研磨垫模型的 CMP 工艺建模和仿真方法,以及项目开发的并行自适应有限元软件平台 PHG。 我们将进一步从并行自适应有限元多重网格方法出发研究复杂的三维非牛顿流问题的数值方法,并结合已有的粗糙研磨垫模型,建立具有自己特点的、精确高效的 CMP 工艺建模和仿真方法及其实现技术。 虽然化学机械抛光 工艺是目前为止唯一成功并大规模使用的平坦化工艺技术,其硅片表面材料的去除机理问题一直在学术界存在较大争议。 在本项目中,我们将进一步系统地研究研磨 液 、 研 磨 颗 粒 以 及 研 磨 垫 与 硅 片 之 间 的 物 理 化 学 作 用 , 完 善“ ReactShearTransport”模型,建立一套完整的、经过验证的 CMP 工艺研磨机制。 三维地震波场正演问题的快速算法和成像反演方法 人们关于地球内部结构的认识大都来自于地震走时层析成像的反演研究,这些认识的取得离不开地震传感技术、海量数字存储能力和高速计算能力的发展,以及三维复杂介质中地 震波传播的理论进展。 但基于射线理论的走时层析成像方法仅使用直达 (沿最短路径传播的 )波震相等有限的到时信息 , 只包含射线路径上很狭小范围内的影响信息,而没有充分利用地震观测台记录到的所有波形信息,即利用地震波从震源经其它路径到达地震台的信息,故它不能对残留在地幔中成分显著不同的岩石层精确地成像。 精细的成像要求我们考虑从不同大小弱散射体上弹回的能量,充分利用地震全波形记录所携带的所有可能震相的振幅和走时信息 ,来提高反演确定地球内部的非均匀结构分辨率,精确地约束确定非均匀体的尺寸、深度和速度差异,尤其是反演获得岩 石圈底部与软流圈复杂过渡带的精细图像,以深入探讨地层破坏的动力学与现今强震活动的关系。 因天然地震和地震台站的分布有限,无法达到对地球内部理想的均匀采样的现实条件下,采用数值方法来计算任意复杂结构的合成地震图,提供了地震层析成像的一种解决途径,促使了发展含各向异性和散射体的复杂结构中地震波传播的理论地震图正演计算的需求。 通过复杂参考模型的理论计算波形与实际观测波形间的互相关分析,定量地测量在不同频段的时间和振幅上的波形差别及反映参考模型误差的敏感度函数,就可以进行地球内部结构的高分辨率全波形反演。 在弹性 考虑下利用有限差分法计算得到的理论地震波形,应用全波形反演方法成功的获得了美国洛杉矶盆地的三维结构; Fichtner 等通过构建时间-频率域的观测与理论波形的偏离函数,给出了进行全球和区域多尺度深部结构的全波形反演成像的一种新途径; Sieminski 等提出了利用理论和实测波形的振幅差异通过SKS 波分裂分析进行上地幔变形的有限频分析途径。 这些研究实例,充分展示了地震全波形反演研究已成为地震层析成像反演的前沿和热点。 我们将 在 Zhao 等提出的散射-积分法基础上,将原有的利用有限差分法模拟地震波在三维介质中的传播过程,进一步扩展计入介质衰减和散射,以及各向异性的不均匀介质的三维波动传播的波形正演计算。 计划针对华北克拉通东部区域进行相关研究,由于区域较大,必须考虑到地球曲率和地形的影响,以及不同分区的耦合和边界连续性问题。 在实际反演计算过程中,因不断地修正模型和求解正问题的需要,致使反演效率很低,且往往需要大量的时间来得到反演结果。 探索应用目前科学计算中的模型降价的方法,在保持问题本质不变的情况下,用一个低阶的问题来代替高阶的问题 ,来获取反映问题本质的反演结果。 2.自适应结构网格并行应用支撑软件框架 网格是 众多重大 科学计算 问题 的 重要 基础 ,网格的质量对计算效率和结果精度均有重大影响。 自适应结构网格是科学计算广泛采用的一类 高质量 网格。 针对该类网格,建立并行应用 支撑 软件框架,是实现科学计算新型计算模式的 关键步骤。 在上一期 973 项目 “高性能科学计算研究 ”的资助下,我们成功研制了自适应结构网格的并行应用支撑软件框架 JASMIN。 该框架适应于数十万亿次计算机,可以在数百上千处理器核上支持高效并行应用软件的研制。 基于该框架,在武器物理、激光聚 变、材料科学等领域已经成功研制多个并行应用软件, 它们 在实际应用中发挥了重要作用。 这些工作为本项目新型计算模式的建立奠定了很好的基础。 针对千万亿次计算, JASMIN 框架需要进一步发展。 首先,随着结点内多CPU/GPU 的异构型体系结构、结点内 “主存 /三级 Cache/二级 Cache/一级 Cache”的多级存储结构、以及处理器内多核共享存储结构的发展,计算机体系结构日趋复杂。 体系结构的复杂 化 必然蕴含数据结构和性能优化的新要求。 目前, JASMIN仅采用网格片的面向对象数据结构,这种数据结构可以很好地削弱多级存储结构对性能的影响,但是,不能较好地适应异构型体系结构和多核共享存储体系结构,因此,必须 研究多层次的高效数据结构,发展与之相适应的 并行计算模型和性能优化方法 ,使并行应用软件自然地匹配于 计算机 结点体系结构。 其次,处理器核数提升 100。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。