[CUDA] Unified Memory (UM)
지금까지 cudaMallocManaged를 사용해 Host 혹은 Device 에서 사용할 메모리를 할당해왔다. cudaMallocManaged가 실제로 어떻게 동작하는지, Unified Memory(UM) 할당 방법에 대한 세부 정보를 모르는 상태에서도 자동 메모리 마이그레이션, 프로그래밍 용이성 등의 이점을 얻었다. nsys 프로필은 가속화된 어플리케이션의 UM 관리에 대한 세부 정보 또한 제공하고, 이 정보를 UM 작동 방식에 대한 보다 자세한 이해와 함께 사용한다면 가속화된 어플리케이션을 최적화할 수 있는 추가적인 기회를 얻을 수 있다. (이렇게 쓰고 보니 게임 같네..) 아래 슬라이드는 향후 설명할 내용을 시각적으로 보여주니 참고하자. UM이 할당되면, 메모리는 host나 device에 아직 상주..