[OpenCL 입문 시리즈 8편] 디버깅 & 프로파일링 기초: 문제 상황 파악과 성능 병목 진단하기
안녕하세요! 지난 글에서 성능 최적화 기초를 다루며 워크그룹 크기 조정, 메모리 접근 패턴 개선, 프로파일링의 중요성을 언급했습니다. 이번 글에서는 한 단계 더 나아가, OpenCL 프로그램을 디버깅하고 성능을 자세히 프로파일링하는 기본적인 방법을 살펴보려 합니다.디버깅과 프로파일링은 생각보다 중요한 영역입니다. 코드가 잘 동작한다고 생각했는데 결과가 이상하거나, 성능이 기대 이하일 수 있어요. 이때 단순히 코드를 쳐다보고 있는 것보다, 디버깅 툴이나 프로파일링 툴을 활용하는 것이 훨씬 효율적입니다.이번 글에서는 다음 내용을 다룹니다.디버깅 기초: 커널 실행 문제 파악, 에러 코드 확인프로파일링 툴 소개: 이벤트(event) 기반 타이밍, Nsight, Intel VTune 등호스트-디바이스 간 데이터 ..