优化英伟达CUDA C/C++加速的N体模拟器认证代码
通过异步流和CUDA C/C++应用程序的可视化性能分析优化N体模拟器。N-body模拟器可预测一组物体通过引力相互作用的运动。一个简单而有效的n-body模拟器01-nbody.cu,适用于在三维空间移动的物体。您可以通过命令行参数设置物体数量。当前仅使用CPU的情况下,4096个物体需要大约5秒才能运行,而65536个物体需要20分钟。您的任务是在保持仿真正确性的前提下,使用GPU加速程序。在开始任务前,请注意保持应用程序的逻辑部分(特别是bodyForce函数)基本不变,重点在于轻松加速应用程序。代码库中有一个在main函数内的"for循环",用于将bodyForce函数计算的物体间的引力集成到系统中每个物体的位置。该集成必须在bodyForce函数运行后进行,并在下一次调用bodyForce函数之前完成。在选择并行化处理方式和程序位置时,请记住这一点。
下载地址
用户评论