개발 일기 썸네일형 리스트형 8월 7일 개발일기 - 해결 이전 문제점인 탐색 시간 [MST] 이 너무 높게 나오는 것을 파악하여 새로운 Reward 설계를 진행하였다.기존 논문과는 다르게 Reward 설계를 해서 새롭게 제시해 주었다. 생각보다 성능과 탐색 시간 모두 이전에 뽑았던 성능들보다 우수하게 나와서 좋았다.논문 제출일이 13일 남았으니까 빠르게 써보자! 더보기 7월 29일 개발일기 - 문제 재 파악 이전 일기 이후로, 해결했다는 생각에 기뻐서 열심히 결과값들을 뽑았다.내 생각보다 둘 다 성능이 좋아 놀랐지만, 드디어 코드를 다 짰다! 라는 생각에 행복했던 것 같다. 결과를 뽑고 나니 새로운 문제가 생겼다.RRT는 Random 한 Tree 구조를 가지기에 목적지까지의 거리를 Reward로 함께 받는다. 이로 인하여 목적지 까지 빨리 가려고 하는 성질이 생겨, 목적지 까지 도착하는 데 걸린 시간인 MST$(Mean Search Time)$이 MCTS 보다 낮게 나오게 되었다. 이게 문제가 되는 것이, STE 문제에서는 빠르게, 정확하게 목적지를 찾는 게 목표라서정확하게 찾는 것은 MCTS가 낫지만, 빠르게 찾는 것이 RRT가 더 우수하게 나오고 있는 것이었다. 그래서 Baseline 코드는 유지한 채,.. 더보기 이전 1 다음