大规模CFD高效CPU/GPU异构并行计算关键技术研究
发布时间:2025-05-20 06:40
计算流体力学(Computational Fluid Dynamics,CFD)采用数值计算方法求解流动控制方程以发现各种流动现象和规律,已广泛应用于航空航天等领域。随着数值模拟的几何外形、物理模型日益复杂,流动机理研究越来越精细,CFD计算的规模和复杂度空前增长,迫切需要利用高性能计算机实现高效CFD并行计算以提升CFD应用效率。近年来,随着图像处理器(Graphics Processing Unit,GPU)浮点运算性能和可编程性的提升,采用CPU/GPU异构体系结构成为构造高性能计算机系统的一种趋势。尽管异构体系结构能够在兼顾通用性和效能的同时大幅提升系统性能,但复杂的硬件架构要求研究者综合利用多种编程模型以挖掘多层次并行性,对高效CFD并行应用开发带来了极大的挑战。本文面向CPU/GPU异构体系结构和典型CFD应用,围绕大规模、高效CFD异构协同并行计算关键技术开展研究,重点研究了CFD应用异构协同并行编程框架、并行算法和性能优化、负载均衡等问题。论文的工作包括:(1)针对多区块结构网格CFD计算的特点,提出了适应大型CPU/GPU异构系统的TLCF三层异构协同编程框架。综合MP...
【文章页数】:160 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.1.1 CFD简介
1.1.2 CFD高性能计算的需求和挑战
1.1.3 CPU/GPU异构计算系统带来的机遇
1.1.4 CFD异构并行计算所遇到的挑战
1.1.5 研究意义
1.2 国内外相关研究现状
1.2.1 CFD发展研究
1.2.2 CPU/GPU异构环境下CFD应用映射和优化研究
1.3 研究内容
1.3.1 主要研究内容及创新
1.3.2 论文结构
第二章 相关背景技术介绍
2.1 空气动力学控制方程及离散格式
2.1.1 传统Navier-Stokes方程及离散格式
2.1.2 格子Boltzmann方程及离散格式
2.2 GPU体系结构
2.2.1 GPU体系结构发展历程
2.2.2 当前主流GPU体系结构
2.3 GPU编程语言发展及CUDA并行编程模型
2.3.1 GPU编程语言发展
2.3.2 CUDA并行编程模型
2.4 小结
第三章 面向多区块结构网格CFD应用的混合异构协同编程框架
3.1 异构并行计算机体系结构特点
3.2 多区块结构网格CFD并行计算特点
3.3 异构并行计算协同编程框架
3.3.1 三层混合异构协同并行编程框架
3.3.2 TLCF框架的实现
3.3.3 异构协同并行编程框架对CFD应用的适用性
3.4 小结
第四章 格子Boltzmann方程大规模高效异构协同并行计算
4.1 引言
4.2 相关工作
4.3 LBM在单GPU上的并行算法
4.3.1 碰撞过程的GPU并行算法
4.3.2 迁移过程的GPU并行算法
4.3.3 边界处理的GPU并行算法
4.4 LBM在CPU/GPU异构系统上的并行算法
4.4.1 基本并行LBM-Base算法
4.4.2 通信与计算重叠并行LBM-overlap算法
4.4.3 CPU/GPU协同并行LBM-hybrid算法
4.5 算法分析
4.5.1 LBM在单GPU上并行算法分析与比较
4.5.2 LBM在CPU/GPU异构系统上并行算法分析与比较
4.6 实验结果
4.6.1 数值验证
4.6.2 单GPU并行方法测试结果
4.6.3 多GPU并行方法测试结果
4.7 小结
第五章 高精度多区块结构网格Navier-Stokes方程高效异构协同并行计算
5.1 引言
5.2 相关工作
5.2.1 高阶精度格式概况
5.2.2 高阶精度格式在异构体系结构上的应用
5.2.3 HOSTA程序
5.3 Navier-Stokes方程在单GPU上并行算法
5.4 Navier-Stokes方程的CPU/GPU协同并行算法
5.4.1 协同并行算法的存储优化
5.4.2 协同并行算法的通信优化
5.5 实现以及实验结果
5.5.1 并行实现
5.5.2 数值实验
5.5.3 单GPU性能结果
5.5.4 单计算节点性能结果
5.5.5 多计算节点性能结果
5.6 小结
第六章 异构系统上CFD计算的负载均衡策略研究
6.1 引言
6.2 粗粒度负载均衡
6.2.1 相关研究
6.2.2 基于性能模型的静态负载均衡
6.2.3 基于预取的任务窃取动态负载均衡
6.2.4 实验结果
6.3 细粒度负载均衡
6.3.1 相关研究
6.3.2 基于稀疏矩阵存储格式的细粒度负载均衡
6.3.3 实验结果
6.4 小结
第七章 结论及展望
7.1 工作总结
7.2 研究展望
致谢
参考文献
作者在学期间取得的学术成果
主要参研项目
本文编号:4047005
【文章页数】:160 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.1.1 CFD简介
1.1.2 CFD高性能计算的需求和挑战
1.1.3 CPU/GPU异构计算系统带来的机遇
1.1.4 CFD异构并行计算所遇到的挑战
1.1.5 研究意义
1.2 国内外相关研究现状
1.2.1 CFD发展研究
1.2.2 CPU/GPU异构环境下CFD应用映射和优化研究
1.3 研究内容
1.3.1 主要研究内容及创新
1.3.2 论文结构
第二章 相关背景技术介绍
2.1 空气动力学控制方程及离散格式
2.1.1 传统Navier-Stokes方程及离散格式
2.1.2 格子Boltzmann方程及离散格式
2.2 GPU体系结构
2.2.1 GPU体系结构发展历程
2.2.2 当前主流GPU体系结构
2.3 GPU编程语言发展及CUDA并行编程模型
2.3.1 GPU编程语言发展
2.3.2 CUDA并行编程模型
2.4 小结
第三章 面向多区块结构网格CFD应用的混合异构协同编程框架
3.1 异构并行计算机体系结构特点
3.2 多区块结构网格CFD并行计算特点
3.3 异构并行计算协同编程框架
3.3.1 三层混合异构协同并行编程框架
3.3.2 TLCF框架的实现
3.3.3 异构协同并行编程框架对CFD应用的适用性
3.4 小结
第四章 格子Boltzmann方程大规模高效异构协同并行计算
4.1 引言
4.2 相关工作
4.3 LBM在单GPU上的并行算法
4.3.1 碰撞过程的GPU并行算法
4.3.2 迁移过程的GPU并行算法
4.3.3 边界处理的GPU并行算法
4.4 LBM在CPU/GPU异构系统上的并行算法
4.4.1 基本并行LBM-Base算法
4.4.2 通信与计算重叠并行LBM-overlap算法
4.4.3 CPU/GPU协同并行LBM-hybrid算法
4.5 算法分析
4.5.1 LBM在单GPU上并行算法分析与比较
4.5.2 LBM在CPU/GPU异构系统上并行算法分析与比较
4.6 实验结果
4.6.1 数值验证
4.6.2 单GPU并行方法测试结果
4.6.3 多GPU并行方法测试结果
4.7 小结
第五章 高精度多区块结构网格Navier-Stokes方程高效异构协同并行计算
5.1 引言
5.2 相关工作
5.2.1 高阶精度格式概况
5.2.2 高阶精度格式在异构体系结构上的应用
5.2.3 HOSTA程序
5.3 Navier-Stokes方程在单GPU上并行算法
5.4 Navier-Stokes方程的CPU/GPU协同并行算法
5.4.1 协同并行算法的存储优化
5.4.2 协同并行算法的通信优化
5.5 实现以及实验结果
5.5.1 并行实现
5.5.2 数值实验
5.5.3 单GPU性能结果
5.5.4 单计算节点性能结果
5.5.5 多计算节点性能结果
5.6 小结
第六章 异构系统上CFD计算的负载均衡策略研究
6.1 引言
6.2 粗粒度负载均衡
6.2.1 相关研究
6.2.2 基于性能模型的静态负载均衡
6.2.3 基于预取的任务窃取动态负载均衡
6.2.4 实验结果
6.3 细粒度负载均衡
6.3.1 相关研究
6.3.2 基于稀疏矩阵存储格式的细粒度负载均衡
6.3.3 实验结果
6.4 小结
第七章 结论及展望
7.1 工作总结
7.2 研究展望
致谢
参考文献
作者在学期间取得的学术成果
主要参研项目
本文编号:4047005
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/4047005.html
上一篇:用户身份可追踪的云共享数据完整性审计方案
下一篇:没有了
下一篇:没有了