정의를 모두에게

  • 홈
  • 태그
  • 방명록

NVIDIA Nsight 1

[CUDA] NVIDIA Command Line Profiler를 이용한 반복적 최적화

가속화된 코드를 최적화하려는 시도가 실제로 성공적이었음을 확인할 수 있는 유일한 방법은 어플리케이션의 성능에 대한 정량적인 지표 및 정보에 대해 응용 프로그램을 프로파일링하는 것이다. nsys(Nsight Systems command line tool)은 가속화된 어플리케이션을 프로파일링하기 위한 강력한 도구로 CUDA toolkit과 함께 제공된다. nsys의 가장 기본적인 사용법은 단순히 nvcc로 컴파일된 실행 파일의 경로를 전달하는 것이다. nsys는 어플리케이션 실행을 진행한 후 어플리케이션의 GPU 활동, CUDA API 호출에 대한 요약 출력 및 Unified Memory 활동에 대한 정보를 보여준다. 어플리케이션을 가속화하거나 이미 가속화 된 어플리케이션을 최적화 할 때, 과학적으로 그리고..

카테고리 없음 2020.10.08
이전
1
다음
더보기
프로필사진

정의를 모두에게

  • 분류 전체보기 (16)
    • 일상 (0)
      • 맛집레이드 (0)
    • 연구개발 (13)
      • Deep Learning (0)
      • C, C++, CUDA (12)
      • Papers (1)

Tag

CUDA, Acceleration Matrix Multiplication, 행렬 곱 가속화, Adaptive Mean Filter, 비동기식 메모리 프리페칭, Stream Multiprocessors, Multi-dimensional block, warps, NVIDIA Nsight, Asynchronous Memory Prefetching, CUDA 오류 처리, Unified Memory, NAMF, Noise Removal Filter, Multi-dimensional grid, cudaDeviceProp, Managing Accelerated Application Memory with CUDA C/C++ Unified Memory, CUDA Streams, nsys, nvidia,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바