이전 일기 이후로, 해결했다는 생각에 기뻐서 열심히 결과값들을 뽑았다.
내 생각보다 둘 다 성능이 좋아 놀랐지만, 드디어 코드를 다 짰다! 라는 생각에 행복했던 것 같다.
결과를 뽑고 나니 새로운 문제가 생겼다.
RRT는 Random 한 Tree 구조를 가지기에 목적지까지의 거리를 Reward로 함께 받는다. 이로 인하여 목적지 까지 빨리 가려고 하는 성질이 생겨, 목적지 까지 도착하는 데 걸린 시간인 MST$(Mean Search Time)$이 MCTS 보다 낮게 나오게 되었다.
이게 문제가 되는 것이, STE 문제에서는 빠르게, 정확하게 목적지를 찾는 게 목표라서
정확하게 찾는 것은 MCTS가 낫지만, 빠르게 찾는 것이 RRT가 더 우수하게 나오고 있는 것이었다.
그래서 Baseline 코드는 유지한 채, Reward 코드를 변경해야 할 것 같다.
앞으로 논문 제출일 까지 약 21일 정도 남았는데 할 수 있겠지...?
'개발 일기' 카테고리의 다른 글
8월 7일 개발일기 - 해결 (0) | 2024.08.07 |
---|---|
7월 24일 개발 일기 (5) | 2024.07.24 |