본문 바로가기

논문 리뷰/STE

Monte Carlo Tree Search [MCTS Path Planning] Monte Carlo Tree Search 알고리즘알파고가 바둑으로 사람을 이긴 것으로 유명해지고 나서 지금까지, AI의 발전은 무궁무진하게 흘러갔다. MCTS는 알파고에서 사용된 알고리즘으로, 강화학습을 사용하는 사람들이나 불확실성에 관련한 연구를 진행하는 사람은 많이 들어봤을 주제이다. MCTS는 시뮬레이션을 거쳐 가장 승률이 좋은 행동을 하는 알고리즘이다.다만, 어떠한 행동을 할 지의 선택지를 정해 주어야 하며, 내가 정한 환경에서만 작동된다.  MCTS에 대해서 얘기 하기 전에 그 근본이 되는 MDP에 대해서 얘기해 보자.MDP란 [Markov Decision Proccess]로, 시간 t에서의 상태는 t-1 에서의 상태에만 영향을 받는다는 정의를 기반으로, 현재 나의 상태에서 행동에 대해서 확률.. 더보기
[논문 리뷰] ASPIRe: An Informative Trajectory Planner with Mutual InformationApproximation for Target Search and Tracking [2024] 1. Abstract여기서는 STE를 SAT[search and tracking]이라고 표현한다. MCTS의 non-myopic[멀리 내다볼 수 있는] 방식을 채택하여 planning을 하려고 하지만, MCTS의 많은 계산량으로 인한 문제점이 존재한다. 이로 인해 MCTS는 제한된 particle filter를 사용한다. 이를 해결하기 위해 이 사람들은 Sigma Point-based mutual information reward pproximation[ASPIRe]를 제시한다. 이는 SP-based인 MI[mutual information]으로, 훨씬 우월한 real-time 계산시간을 보여주고, search에 대한 효율성을 지닌다.2. Main[System Formulation]Sensor model.. 더보기
[논문 리뷰] 'Infotaxis' as a strategy for searching without gradients(2007) 논문 이전에 Path Planning에 대한 관심은 언제나 존재한다. 로봇의 자율주행 기능을 책임지는 Path Planning은 전체적인 지도[Map]를 지니고 있을 때의 경로를 제작하는 Global Planning, 카메라, LiDAR 등의 센서 데이터를 받아와 시간에 따라 현재 위치에서 목적지와 충돌 가능한 장애물 등을 고려한 Local Planning[Motion planning 이 여기에 속해 있을 것이다.] 등이 있다. 이러한 기술들은 차량 자율 주행, 로봇의 목적지 도착에 주로 쓰이며, 움직여 목적지에 도착을 해야하는 Task를 가진 임무에는 어디든 쓰인다고 생각하면 된다. 그래서 주로, 로봇 전문가 및 자동차, 무인이동체 등의 개발자는 필수적으로 필요한 개념이다. 오늘 소개할 논문은 Info.. 더보기