【CUDA 基础】3.5 展开循环
Abstract: 本文介绍循环展开技术,在归约的基础上继续加速。 Keywords: 展开归约,归约,模板函数 ...
Abstract: 本文介绍循环展开技术,在归约的基础上继续加速。 Keywords: 展开归约,归约,模板函数 ...
Abstract: 介绍规约问题中的分支分化问题 Keywords: 规约问题,分支分化 此篇有些结果和参考书中结果相反,需要更深入的技术才能解决 ...
Abstract: 本文主要通过nvprof工具来分析核函数的执行效率(资源利用率) Keywords: nvprof ...
Abstract: 本文介绍CUDA线程束执行的本质的后半部分,包括资源,延迟,同步,扩展性等严重影响性能的线,吞吐量,带宽,占用率,CUDA同步 ...
Abstract: 本文介绍CUDA执行模型最核心的部分,线程束的执行实质第一部分 Keywords: CUDA分支,线程束分化 ...
Abstract: 本文介绍CUDA执行模型,只比硬件高一层的抽象 Keywords: CUDA SM,SIMT,SIMD,Fermi,Kepler ...
Abstract: 本文只介绍一个功能,如何获取设备(一个或多个)信息 Keywords: CUDA Device Information ...
Abstract: 本文介绍CUDA模型中的线程组织模式 Keywords: Thread,Block,Grid ...
Abstract: 本文介绍CUDA核函数计时方法 Keywords: gettimeofday,nvprof ...
Abstract: 本文继续上文介绍CUDA编程模型关于核函数以及错误处理部分 Keywords: CUDA核函数,CUDA错误处理 ...