【CUDA】overview
Hello, CUDA
一、 硬件架构分析(Ampere)
1. 架构总览

我们先从架构总览里知道有几个核心概念:
GPC(Graphics Processing Cluster)TPC(Texture Processing Cluster)SM(Streaming Multiprocessor)Warp SchedulerCUDA Core/Tensor CoreRT Core
二、 CUDA编程模型
三、hello world代码解析
1 | /* |
我们先解析一下代码,相比较纯C++代码,有三个陌生的点:
__global__; 他的告诉编译器这个是个可以在设备上执行的核函数hello_world<<<1, 10>>>: 他的作用是,告诉编译器,我的这个计算任务是由1个grip和10个block组成。cudaDeviceReset: 这句话告诉cpu侧,即host侧,你得等等GPU跑完你再往下。

