【CUDA 基础】5.3 减少全局内存访问

Abstract: 本文介绍使用共享内存进行归约,并比较全局内存归约与共享内存归约之间的性能差距 Keywords: 共享内存,归约 ...

June 4, 2018 · 谭升

【CUDA 基础】3.5 展开循环

Abstract: 本文介绍循环展开技术,在归约的基础上继续加速。 Keywords: 展开归约,归约,模板函数 ...

April 19, 2018 · 谭升