【CUDA 基础】5.2 共享内存的数据布局

Abstract: 本文主要研究几个关于共享内存的例子,以此来了解共享内存的性质,为我们的核函数加速 Keywords: 行主序,列主序,填充与无填充,从线程索引体映射数据元素 ...

June 2, 2018 · 谭升

【CUDA 基础】5.1 CUDA共享内存概述

Abstract: 本文为CUDA内存的概述,介绍共享内存的模型,分配,访问,配置,同步等内容 Keywords: 模型,分配,访问,配置,同步 ...

June 1, 2018 · 谭升

【CUDA 基础】5.0 共享内存和常量内存

Abstract: 本文是第五章关于CUDA共享内存和常量内存的概述 Keywords: 共享内存,常量内存 ...

June 1, 2018 · 谭升

【CUDA 基础】4.5 使用统一内存的向量加法

Abstract: 使用统一内存的CUDA程序——向量加法 Keywords: 统一内存,Uniform Memory ...

May 14, 2018 · 谭升

【CUDA 基础】4.4 核函数可达到的带宽

Abstract: 本文通过矩阵转置这一个例子,调整,优化核函数,使其达到最优的内存带宽 Keywords: 带宽,吞吐量,矩阵转置 ...

May 13, 2018 · 谭升

【CUDA 基础】4.3 内存访问模式

Abstract: 本文介绍内存的访问过程,也就是从应用发起请求到硬件实现的完整操作过程,这里是优化内存瓶颈的关键之处,也是CUDA程序优化的基础。 Keywords: 内存访问模式,对齐,合并,缓存,结构体数组,数组结构体 ...

May 3, 2018 · 谭升

【CUDA 基础】4.2 内存管理

Abstract: 本文主要介绍CUDA内存管理,以及CUDA内存模型下的各种内存的特点。 Keywords: CUDA内存管理,CUDA内存分配和释放,CUDA内存传输,固定内存,零拷贝内存,统一虚拟寻址,统一内存寻址 ...

May 1, 2018 · 谭升

【CUDA 基础】4.1 内存模型概述

Abstract: 本文介绍CUDA编程的内存模型个概述,主要讲解CUDA包含的几种内存,以及各种内存的主要特点和用途,这篇作为内存部分地图一样,指导我们后面的写作和学习。 Keywords: CUDA内存模型,CUDA内存层次结构,寄存器,共享内存,本地内存,常量内存,纹理内存,全局内存 ...

April 28, 2018 · 谭升

【CUDA 基础】4.0 全局内存

Abstract: 本文为学习CUDA编程的第四章的概要,主要介绍第四章研究的对象 Keywords: 全局内存,CUDA内存模型,CUDA内存管理,全局内存编程,全局内存访问模式,全局内存数据布局,统一内存编程,提高内存吞吐量。 ...

April 28, 2018 · 谭升

【CUDA 基础】3.6 动态并行

Abstract: 本文介绍CUDA动态并行——在设备上运行时的网格启动新的子网格 Keywords: 动态并行,嵌套执行 ...

April 24, 2018 · 谭升