'프로파일링' 태그의 글 목록

[SYCL 입문 #6] 간단한 벤치마크 및 성능 분석 기초

SYCL 입문 시리즈의 여섯 번째 글입니다. 지금까지 SYCL 기초 개념(메모리 모델, 커널 작성), 다양한 디바이스(NVIDIA, Qualcomm GPU) 지원 전략, ND-Range와 로컬 메모리, USM 등 최적화 개념까지 살펴보았습니다. 이번 글에서는 이제까지 익힌 내용을 기반으로 간단한 벤치마크를 수행하고, 성능 차이를 관찰하는 방법을 소개합니다. 또한, 디버깅/프로파일링 도구(RenderDoc, Nsight Graphics, Intel VTune 등)를 간단히 연계해, SYCL 코드의 성능 분석 기초를 다뤄보겠습니다.목표이전 글에서 만든 매트릭스 곱(또는 벡터 연산) 예제를 반복 실행하며 시간 측정ND-Range 워크그룹 크기 변화, 로컬 메모리 사용 여부에 따라 성능 차이 관찰간단한 타이머(..

format_list_bulleted 개발 이야기/SYCL (시클)
· 2024. 12. 20.
textsms

[OpenCL 입문 시리즈 8편] 디버깅 & 프로파일링 기초: 문제 상황 파악과 성능 병목 진단하기

안녕하세요! 지난 글에서 성능 최적화 기초를 다루며 워크그룹 크기 조정, 메모리 접근 패턴 개선, 프로파일링의 중요성을 언급했습니다. 이번 글에서는 한 단계 더 나아가, OpenCL 프로그램을 디버깅하고 성능을 자세히 프로파일링하는 기본적인 방법을 살펴보려 합니다.디버깅과 프로파일링은 생각보다 중요한 영역입니다. 코드가 잘 동작한다고 생각했는데 결과가 이상하거나, 성능이 기대 이하일 수 있어요. 이때 단순히 코드를 쳐다보고 있는 것보다, 디버깅 툴이나 프로파일링 툴을 활용하는 것이 훨씬 효율적입니다.이번 글에서는 다음 내용을 다룹니다.디버깅 기초: 커널 실행 문제 파악, 에러 코드 확인프로파일링 툴 소개: 이벤트(event) 기반 타이밍, Nsight, Intel VTune 등호스트-디바이스 간 데이터 ..

format_list_bulleted 개발 이야기/OpenCL
· 2024. 12. 14.
textsms

[OpenCL 입문 시리즈 7편] 성능 최적화 맛보기: 워크그룹, 메모리 접근 패턴, 프로파일링 기초

안녕하세요! 지난 글에서는 OpenCL을 활용한 이미지 처리 예제를 다루며, 실제로 GPU 가속의 이점을 경험해봤습니다. 이제부터는 좀 더 깊은 주제로 들어가, 성능 최적화(Performance Optimization)에 대한 기본 개념을 살펴보려 해요. 입문자 수준에서 모든 최적화를 다루기는 어렵지만, 워크그룹(work-group) 설정, 메모리 접근 패턴 개선, 그리고 프로파일링(profiling) 도구 활용으로 성능을 개선할 수 있는 아이디어를 얻을 수 있습니다.이번 글에서는 다음 내용을 다룹니다.워크아이템(work-item), 워크그룹(work-group) 개념과 성능 관계메모리 계층(global, local, private memory)과 접근 패턴 최적화프로파일링을 통한 병목 지점 확인CUDA..

format_list_bulleted 개발 이야기/OpenCL
· 2024. 12. 13.
textsms

[CUDA & Modern C++로 GPU 프로그래밍 시작하기] #8: 디버깅과 성능 프로파일링 기초

지금까지 우리는 CUDA 프로그래밍 기초부터 시작해 Host-Device 메모리 관리, 스레드/블록/그리드 개념, 비동기 스트림, 메모리 계층(Shared/Constant) 최적화 기법, 그리고 CMake와 Modern C++를 활용한 빌드 환경 개선까지 쭉 달려왔습니다. 이제 어느 정도 기본기가 갖추어졌다면, 실제 GPU 코드가 의도대로 동작하고 있는지 확인하고, 혹시 병목현상이 일어나지는 않는지 점검하는 단계가 필요합니다. 이번 글에서는 디버깅(Debugging)과 성능 프로파일링(Performance Profiling) 방법을 간단히 살펴볼 겁니다. 한 번에 모든 툴과 기법을 다루긴 어렵지만, 대표적인 도구와 기본적인 절차를 익혀두면 앞으로 문제 해결에 큰 도움이 됩니다.GPU 디버깅 기본 아이디어..

format_list_bulleted 개발 이야기/CUDA
· 2024. 12. 12.
textsms

[SYCL 입문 #6] 간단한 벤치마크 및 성능 분석 기초

[OpenCL 입문 시리즈 8편] 디버깅 & 프로파일링 기초: 문제 상황 파악과 성능 병목 진단하기

[OpenCL 입문 시리즈 7편] 성능 최적화 맛보기: 워크그룹, 메모리 접근 패턴, 프로파일링 기초

[CUDA & Modern C++로 GPU 프로그래밍 시작하기] #8: 디버깅과 성능 프로파일링 기초

티스토리툴바