【CUDA 基础】3.5 展开循环

Abstract: 本文介绍循环展开技术,在归约的基础上继续加速。 Keywords: 展开归约,归约,模板函数 ...

April 19, 2018 · 谭升

【CUDA 基础】3.4 避免分支分化

Abstract: 介绍规约问题中的分支分化问题 Keywords: 规约问题,分支分化 此篇有些结果和参考书中结果相反,需要更深入的技术才能解决 ...

April 17, 2018 · 谭升

【CUDA 基础】3.3 并行性表现

Abstract: 本文主要通过nvprof工具来分析核函数的执行效率(资源利用率) Keywords: nvprof ...

April 15, 2018 · 谭升

【CUDA 基础】3.2 理解线程束执行的本质(Part II)

Abstract: 本文介绍CUDA线程束执行的本质的后半部分,包括资源,延迟,同步,扩展性等严重影响性能的线,吞吐量,带宽,占用率,CUDA同步 ...

March 15, 2018 · 谭升

【CUDA 基础】3.2 理解线程束执行的本质(Part I)

Abstract: 本文介绍CUDA执行模型最核心的部分,线程束的执行实质第一部分 Keywords: CUDA分支,线程束分化 ...

March 14, 2018 · 谭升

【CUDA 基础】3.1 CUDA执行模型概述

Abstract: 本文介绍CUDA执行模型,只比硬件高一层的抽象 Keywords: CUDA SM,SIMT,SIMD,Fermi,Kepler ...

March 12, 2018 · 谭升

【CUDA 基础】2.4 GPU设备信息

Abstract: 本文只介绍一个功能,如何获取设备(一个或多个)信息 Keywords: CUDA Device Information ...

March 10, 2018 · 谭升

【CUDA 基础】2.3 组织并行线程

Abstract: 本文介绍CUDA模型中的线程组织模式 Keywords: Thread,Block,Grid ...

March 9, 2018 · 谭升

【CUDA 基础】2.2 给核函数计时

Abstract: 本文介绍CUDA核函数计时方法 Keywords: gettimeofday,nvprof ...

March 8, 2018 · 谭升

【CUDA 基础】2.1 CUDA编程模型概述(二)

Abstract: 本文继续上文介绍CUDA编程模型关于核函数以及错误处理部分 Keywords: CUDA核函数,CUDA错误处理 ...

February 16, 2018 · 谭升