1. 학습관점
R-CNN은 오직 마지막 단의 SVM classifier만 학습 가능
Fast R-CNN은 첫 feature map을 뽑는 CNN도 학습이 가능
Faster R-CNN은 region proposal network로 모든 과정이 학습 가능

R-CNN에 언급 한번 안한 box regression이 있다는 것이 특이한데 실제로 가능하다고 한다
2. input size 관점
R-CNN은 CNN을 2000번 돌리며 CNN에 들어가는 input size는 고정되어있다
Fast R-CNN 이후는 ROI pooling을 이용하여 CNN의 input size를 임의로 해도 동작하도록 만들었다
3. region proposal 관점
Fast R-CNN까지 region proposal로 selective search로 미리 찾아야 했다
Faster R-CNN에서 region proposal network를 설계하여 모든 과정이 한번에 가능하며 학습도 가능하게 만들었다
728x90
'딥러닝 > Computer Vision' 카테고리의 다른 글
불균형 데이터에 효과적인 Focal loss (0) | 2022.05.16 |
---|---|
YOLO(You only look once)의 원리 알아보기 (0) | 2022.05.10 |
R-CNN에서 가장 발전된 Faster R-CNN에 대하여 (0) | 2022.05.05 |
object detection을 위한 R-CNN과 Fast R-CNN의 원리 (0) | 2022.05.05 |
object detection이란 무엇인가? (0) | 2022.05.03 |