[Ray RLlib로 강화학습 쉽게 사용하기] 7편: 사용자 정의 환경, 관측/행동 전처리, 콜백 활용하기
이전까지는 주로 Gym에 내장된 표준 환경(CartPole, MountainCar, Atari 등)을 활용했습니다. 그러나 실제 문제 해결 과정에서는 고유한 시뮬레이터나 데이터 소스에서 얻은 관측을 RL 환경으로 구성하고, 에이전트가 특정 형식의 행동을 내도록 설계해야 할 수 있습니다. 또한 RL 실험 중간에 특정 이벤트에 반응하거나, 관측값을 가공하는 등의 커스터마이징이 필요할 수도 있습니다.이번 글에서는 다음 내용을 다룹니다.사용자 정의 Gym 환경을 RLlib에 등록하고 적용하기Observation/Action Wrapper를 통한 관측, 행동 전처리콜백(Callbacks)을 활용한 로그 확장, 성능 조건부 로직 삽입사용자 정의 환경 연동RLlib은 기본적으로 Gym 인터페이스에 맞는 환경이면 어떤..