AirSim에서 RL하기 (4) - Env(환경) 제작
AirSim에서 RL을 진행하며 가장 어려웠던 부분이 Env(환경)을 제작하는 부분이다. 나는 학습 코드를 다음과 같이 구성하였다. Main 환경과 강화학습 Model 사이에서, AirSim을 연결하여 실제 학습을 진행하는 코드이다. Main에서 학습이 진행이 되며, 다양한 파라미터, 모델 저장, Reward 비교 등을 설정할 수 있다. Model 강화학습에서 학습을 진행하기 위해 구현되어 져 있는 학습 모델을 의미한다. 다양한 RL 모델(PPO, TD3, DDQN, DQN, SAC 등)을 이용하여 AirSim 에서의 학습에서 적합한 모델을 확인하려 한다. Env 학습에 필요한 환경이다. Model에 들어가는 parameter가 Main에서 설정을 해 주었다면, Model에서의 State, Action ..
더보기