일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
Tags
- 정보이론
- 세계에서 이 세상이 사라진다 해도
- ROS2
- dino #grounding dino #vlm #object detection
- path planning #mcts
- 탐색
- Unity
- vision language model #transformer
- ROS1
- 로봇 #로봇공학과 #공대생 #대학생 #일상 #휴무 #교수
- vlm 정리 #glip #object detection
- AirSim #RL #Drone
- 소울러닝 #책리뷰 #느낀점
- Infotaxis
- planning #ste #논문 리뷰
- ste
- 개발 일기
- 자율주행 #로봇공학과
- vlm #clip #object detection
- 코드 트리 #개발자 #언어 공부 #코딩 공부
- 책 #오늘 밤
- 경로 계획
Archives
- Today
- Total
목록vlm #clip #object detection (1)
퇴근할게요 교수님

CLIP: Learning Transferable Visual Models from Natural Language Supervision 0. 시작하기 전에최근 DETR[End to End Detection]을 통해서 VLM을 이용한 객체 탐지[object detection]이 핫하다. 이 중 VLM의 시초라 할 수 있는 CLIP이라는 논문에 대해서 리뷰해 보았다.1. CLIP란?CLIP[Contrastive Language-Image Pre-training]은 OpenAI에서 제안한 모델로, 이미지와 텍스트 쌍을 통해 학습하는 대규모 학습 기법이다. 기존 이미지 분류 모델들은 고정된 범주를 예측하도록 학습되지만, CLIP은 훨씬 더 유연하게 동작한다. 인터넷에 있는 방대한 이미지-텍스트 쌍을 이용해 이미..
논문 리뷰/VLM
2025. 3. 3. 17:20