1. 首页
  2. 行业
  3. 制造
  4. DSP中的基于CPU GPU 异构机群的FDTD 并行算法加速研究(二)

DSP中的基于CPU GPU 异构机群的FDTD 并行算法加速研究(二)

上传者: 2020-10-28 02:44:36上传 PDF文件 184.8KB 热度 15次
2 GPU 并行加速算法 GPU 具有高度并行的多流水线架构,使其非常适宜于FDTD 加速运算。与CPU 运算的多次循环逐网格迭代更新方式不同,GPU 可以实现多网格的同时迭代更新,配合GPU 的线程集指令执行机制,可以高效地利用流水线资源,隐藏流处理器与设备内存间的场量读写延时,从而实现FDTD 运算加速。 2.1 GPU 核心函数的并行 2.1.1 数据并行优化 OpenCL 支持按数据并行的编程模型和按任务并行的编程模型。数据并行是一种普遍意义上的并行方式,在程序中,常有一些循环操作,如果在循环的内部各个计算过程之间不存在相关性,则可以转换成并行循环,即数据并行。
下载地址
用户评论