【CUDA 基础】4.4 核函数可达到的带宽

Abstract: 本文通过矩阵转置这一个例子,调整,优化核函数,使其达到最优的内存带宽 Keywords: 带宽,吞吐量,矩阵转置 ...

May 13, 2018 · 谭升

【CUDA 基础】3.2 理解线程束执行的本质(Part II)

Abstract: 本文介绍CUDA线程束执行的本质的后半部分,包括资源,延迟,同步,扩展性等严重影响性能的线,吞吐量,带宽,占用率,CUDA同步 ...

March 15, 2018 · 谭升