[CUDA] 다차원 Grid 및 Block
Grid와 Block은 3차원까지 정의 가능하다. 다차원을 사용하는 데 있어 성능 상의 이점은 없지만, 행렬/영상 등과 같은 다차원 데이터를 처리하는 데에는 유용하다. grid나 block을 2, 3차원으로 정의하기 위해서는 dim3 type을 아래와 같이 사용한다. dim3 threads_per_block(16, 16, 1); dim3 number_of_blocks(16, 16, 1); someKernel(); 위와 같은 예시에서, kernel 내의 gridDim.x, gridDim.y, blockDim.x, blockDim.y 는 모두 16으로 같다. 2차원 행렬 곱셈을 가속화하기 위한 두 개의 예제코드를 NVIDIA DLI 예제로부터 그대로 가져왔다. #include #define N 64 __gl..