가속화된 코드를 최적화하려는 시도가 실제로 성공적이었음을 확인할 수 있는 유일한 방법은 어플리케이션의 성능에 대한 정량적인 지표 및 정보에 대해 응용 프로그램을 프로파일링하는 것이다. nsys(Nsight Systems command line tool)은 가속화된 어플리케이션을 프로파일링하기 위한 강력한 도구로 CUDA toolkit과 함께 제공된다. nsys의 가장 기본적인 사용법은 단순히 nvcc로 컴파일된 실행 파일의 경로를 전달하는 것이다. nsys는 어플리케이션 실행을 진행한 후 어플리케이션의 GPU 활동, CUDA API 호출에 대한 요약 출력 및 Unified Memory 활동에 대한 정보를 보여준다. 어플리케이션을 가속화하거나 이미 가속화 된 어플리케이션을 최적화 할 때, 과학적으로 그리고..